既然玩了 ai 聊天的东西,顺便折腾下画画的东西。搜了下,发现了 Stable Diffusion。
操作环境:Windows 11 Python 3.10
下载代码
在适当的地方,新建文件夹,准备获取代码。不带其他任何模型的默认版本大概 7G。模型也是 GB 级别,所以空间可以适当留大一点。另外,目录的路径中不要带中文。
打开命令行,进入待安装的目录下,执行指令获取代码。
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
运行和下载部件
获取完代码后,运行获取到的 webui.bat 。因为我们没有显卡,因此需要加上参数,运行:
./webui --skip-torch-cuda-test --no-half
这两个参数是跳过 CUDA(依赖于显卡的加速算法)以及禁用半精度运算,规避报错。
脚本首先会获取依赖项,随后会获取依赖项目,然后会获取默认模型。最终启动WebUI服务器。直到提示
Running on local URL: http://127.0.0.1:7860
这时候,Web 服务就启动成功了。接下来打开浏览器,就可以开始画起来了。
输入描述来画图。只能用英文描述关键词。
cpu 占用不是很大,不影响打开一个 vscode。
不过还是慢。我的笔记本 512x512 的需要 5 分钟。。1000x600 的 20 分钟。。
点 save 保存,文件默认在 stable-diffusion-webui\outputs\txt2img-images
老鹰抓小鸡。。
画出来的人脸全是花的。。。吓人。
部件下载问题
无法下载 gfpgan 就手工下载
git clone https://ghproxy.com/github.com/TencentARC/GFPGAN.git
算了,直接改 launch.py 中的链接
中文提示词
提示词只支持英文也是无奈,国内的太乙还不支持 cpu
安装个 Prompt Translator,输入中文自动用百度翻译
本地化界面
另一个界面库 invokeai 里面有本地化文件,下载后在 invokeai\frontend\web\dist\locales 能找到,复制到
stable-diffusion-webui\localizations 中。
然后再界面配置中选择 zh_CN,重启服务。
面部修复
在配置界面上选择面部修复。似乎没什么用。
用 lora 模型似乎没问题。。可能是提示词的问题