Stable Diffusion 是一个基于深度学习的图像生成模型,可以通过文本描述生成高质量的图像。为了在 Windows 本地部署 Stable Diffusion,您可以选择不同的部署方式:手动安装、使用自动安装脚本、或使用整合包。本教程将详细介绍这三种部署方式,并提供代码和步骤,以便您能够顺利地在 Windows 环境下使用 Stable Diffusion。
一、前期准备
在开始之前,确保您的系统满足以下要求:
- 操作系统:Windows 10/11 64 位
- 硬件要求:
- 至少 8GB 的 RAM
- 显卡:支持 CUDA 的 NVIDIA GPU(推荐至少有 6GB 显存)
- 软件要求:
- Python 3.8+
- CUDA 11.3+(如果使用 GPU)
- NVIDIA驱动程序(与 CUDA 版本兼容)
- Git:用于从 GitHub 克隆仓库
- Visual Studio 2019+:用于编译需要的 C++ 扩展
二、手动安装(推荐高级用户)
手动安装步骤适用于熟悉 Python 和环境配置的用户,可以完全掌控安装过程,并灵活地选择依赖项和库版本。
1. 安装 Python 和必要的依赖
-
下载 Python:
- 请前往 Python 官网 下载并安装 Python 3.8 或更高版本。
- 在安装时勾选 “Add Python to PATH”。
-
安装 Git:
- Git 官网 下载并安装 Git。
-
安装 CUDA 和 NVIDIA 驱动:
- 前往 NVIDIA 官网 下载并安装 CUDA(需要与您的 GPU 驱动版本兼容)。
2. 克隆 Stable Diffusion 仓库
使用 Git 克隆 Stable Diffusion 仓库:
git clone https://github.com/CompVis/stable-diffusion.git
cd stable-diffusion
3. 创建虚拟环境并安装依赖
在项目文件夹内,使用以下命令创建虚拟环境,并激活它:
python -m venv venv
venv\Scripts\activate # Windows 下激活虚拟环境
然后,安装所有依赖项:
pip install -r requirements.txt
4. 下载模型权重文件
Stable Diffusion 模型的权重文件比较大,通常需要下载预训练的权重。
- 注册 Hugging Face 账户:Hugging Face 官网。
- 登录后,访问 Stable Diffusion 权重文件页面 并下载模型权重。
- 将下载的权重文件放置在项目目录的
models/ldm/stable-diffusion-v1/
文件夹下。
5. 运行模型生成图像
配置完成后,您可以通过以下命令运行 Stable Diffusion 并生成图像:
python scripts/txt2img.py --prompt "A futuristic city" --plms
这会根据提供的文本描述(例如:“A futuristic city”)生成一张图像。
三、使用自动安装脚本(简单方式)
对于希望简化安装过程的用户,可以使用自动安装脚本,几乎一键完成配置和安装。
1. 下载自动化脚本
使用 Stable Diffusion WebUI 提供的自动化脚本,它集成了多个功能,并且非常易于安装。首先,克隆该仓库:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui
2. 安装依赖
运行以下命令自动安装所需的所有依赖项:
python launch.py
脚本会自动检测您的环境并安装所有依赖。
3. 下载模型
根据提示,脚本会自动帮助您下载模型权重文件。或者您也可以手动下载模型文件并将其放置在 models/Stable-diffusion/
文件夹内。
4. 启动 Web UI
安装完成后,您可以启动 Web UI:
python launch.py
然后在浏览器中访问 http://127.0.0.1:5000/
即可使用图形化界面生成图像。
5. 生成图像
通过 Web 界面,您可以输入文本描述并生成图像,支持调整各类参数,如采样方法、步数、图像分辨率等。
四、使用整合包安装(最简单方式)
对于新手用户或希望快速搭建环境的用户,使用整合包(如 Stable Diffusion WebUI)是一种非常方便的选择。这些包已经打包好了所有必要的依赖项和配置文件。
1. 下载整合包
您可以直接下载已经集成了 Stable Diffusion 的整合包。例如,从 AUTOMATIC1111 的 GitHub 仓库 下载整个项目。
2. 解压与安装
- 下载 ZIP 文件并解压。
- 打开解压后的文件夹,运行
webui-user.bat
(Windows)文件,脚本会自动安装所需的 Python 环境和依赖。
3. 启动服务
双击 webui-user.bat
文件,启动服务后,您可以在浏览器中访问 http://127.0.0.1:5000/
来使用 Web UI 界面进行图像生成。
五、常见问题与解决方案
1. 模型文件下载失败
- 确保您已经正确注册了 Hugging Face 账号,并且在下载模型时使用了正确的 API 密钥。
- 可以手动从 Hugging Face 上下载模型文件,解压并将其放置在正确的文件夹中。
2. 缺少 CUDA 或 GPU 不支持
- 如果您没有支持 CUDA 的 NVIDIA GPU,可以考虑仅使用 CPU 来运行模型,但速度会较慢。
- 确保您安装了适配的 CUDA 版本,并且 GPU 驱动程序也是最新的。
3. 安装依赖问题
-
如果在安装依赖时遇到问题,建议使用以下命令来更新
pip
:python -m pip install --upgrade pip
-
如果某些包无法安装,可以尝试使用
--no-cache-dir
标志:pip install -r requirements.txt --no-cache-dir
4. 生成的图像质量较差
- 增加采样步数(例如将
--n_iter
设置为更高的值),或者更改采样方法(如使用plms
)。 - 您还可以通过调整提示词的具体性来获得更好的图像结果。
六、总结
在 Windows 上部署 Stable Diffusion 的方法有三种:手动安装、自动化安装脚本和整合包安装。根据您的需求和技术熟练度,可以选择合适的方式进行安装。如果您是初学者,推荐使用自动化安装脚本或整合包,这两种方式较为简单且支持图形化界面,适合快速搭建实验环境。
在安装完成后,您可以通过提供文本描述来生成图像,并进一步探索 Stable Diffusion 在图像生成、艺术创作等领域的潜力。