既然玩了 ai 聊天的东西,顺便折腾下画画的东西。搜了下,发现了 Stable Diffusion。

操作环境:Windows 11 Python 3.10


下载代码

在适当的地方,新建文件夹,准备获取代码。不带其他任何模型的默认版本大概 7G。模型也是 GB 级别,所以空间可以适当留大一点。另外,目录的路径中不要带中文。

打开命令行,进入待安装的目录下,执行指令获取代码。

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

运行和下载部件

获取完代码后,运行获取到的 webui.bat 。因为我们没有显卡,因此需要加上参数,运行:

./webui --skip-torch-cuda-test --no-half

这两个参数是跳过 CUDA(依赖于显卡的加速算法)以及禁用半精度运算,规避报错。

脚本首先会获取依赖项,随后会获取依赖项目,然后会获取默认模型。最终启动WebUI服务器。直到提示

Running on local URL: http://127.0.0.1:7860

这时候,Web 服务就启动成功了。接下来打开浏览器,就可以开始画起来了。

输入描述来画图。只能用英文描述关键词。

cpu 占用不是很大,不影响打开一个 vscode。

不过还是慢。我的笔记本 512x512 的需要 5 分钟。。1000x600 的 20 分钟。。

点 save 保存,文件默认在 stable-diffusion-webui\outputs\txt2img-images

老鹰抓小鸡。。

画出来的人脸全是花的。。。吓人。

部件下载问题

无法下载 gfpgan 就手工下载

git clone https://ghproxy.com/github.com/TencentARC/GFPGAN.git

算了,直接改 launch.py 中的链接

中文提示词

提示词只支持英文也是无奈,国内的太乙还不支持 cpu

安装个 Prompt Translator,输入中文自动用百度翻译

本地化界面

另一个界面库 invokeai 里面有本地化文件,下载后在 invokeai\frontend\web\dist\locales 能找到,复制到
stable-diffusion-webui\localizations 中。

然后再界面配置中选择 zh_CN,重启服务。

面部修复

在配置界面上选择面部修复。似乎没什么用。

用 lora 模型似乎没问题。。可能是提示词的问题