顺便折腾下 Stable Diffusion

既然玩了 ai 聊天的东西，顺便折腾下画画的东西。搜了下，发现了 Stable Diffusion。

操作环境：Windows 11 Python 3.10

在适当的地方，新建文件夹，准备获取代码。不带其他任何模型的默认版本大概 7G。模型也是 GB 级别，所以空间可以适当留大一点。另外，目录的路径中不要带中文。

打开命令行，进入待安装的目录下，执行指令获取代码。

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

获取完代码后，运行获取到的 webui.bat 。因为我们没有显卡，因此需要加上参数，运行：

./webui --skip-torch-cuda-test --no-half

这两个参数是跳过 CUDA（依赖于显卡的加速算法）以及禁用半精度运算，规避报错。

脚本首先会获取依赖项，随后会获取依赖项目，然后会获取默认模型。最终启动WebUI服务器。直到提示

Running on local URL: http://127.0.0.1:7860

这时候，Web 服务就启动成功了。接下来打开浏览器，就可以开始画起来了。

输入描述来画图。只能用英文描述关键词。

cpu 占用不是很大，不影响打开一个 vscode。

不过还是慢。我的笔记本 512x512 的需要 5 分钟。。1000x600 的 20 分钟。。

点 save 保存，文件默认在 stable-diffusion-webui\outputs\txt2img-images

老鹰抓小鸡。。

画出来的人脸全是花的。。。吓人。

无法下载 gfpgan 就手工下载

git clone https://ghproxy.com/github.com/TencentARC/GFPGAN.git

算了，直接改 launch.py 中的链接

提示词只支持英文也是无奈，国内的太乙还不支持 cpu

安装个 Prompt Translator，输入中文自动用百度翻译

另一个界面库 invokeai 里面有本地化文件，下载后在 invokeai\frontend\web\dist\locales 能找到，复制到
stable-diffusion-webui\localizations 中。

然后再界面配置中选择 zh_CN，重启服务。

在配置界面上选择面部修复。似乎没什么用。

用 lora 模型似乎没问题。。可能是提示词的问题