当前位置: 首页AI绘图正文 这篇文章将简介Stable Diffusion WebUI的安装过程,以及介绍文生图、图生图、内补绘制的用法。 Stable Diffusion WebUI是能用AI技术绘制图片的开源软件,只要给定一组描述文字,AI就会画图出来; 亦能模仿现有的图片里面的姿势,画出另一张图片。 甚至给它图片将一部分涂黑,AI也能按照你的意愿将图片填上适当的内容。 除此之外还支持自行训练模型加强绘制效果。 一些Stable Diffusion WebUI的绘图,无后期处理。 与其他云端AI绘图软件Midjoruney、NovelAI相比,Stable Diffusion WebUI最大优点是可以免费在自己的电脑或服务器跑,且只要遵照Creative ML OpenRAIL-M授权条款的话,几无使用限制。 因其开放源代码的特性,任何人都可以贡献代码,参与改进项目。 Stable Diffusion是一个扩散模型,最早由CompVis发布并推出相关程序。 本文Ivon则采用较多人使用的AUTOMATIC1111开发的图形化版本,支持Linux/Windows/MacOS系统,以及Nvidia/AMD/Apple的GPU。 其图形界面是通过网页访问的,上手无难度,还有社交制作的界面中文化扩充功能能装。 不过AI绘图十分吃GPU性能,建议:操作系统为Windows 10以上,GPU为Nvidia GTX1050 Ti (VRAM 4GB)以上等级,RAM大于8GB,再来尝试Stable Diffusion WebUI。 1. 测试环境 本文为Windows系统的安装过程,Linux的安装过程请参考这篇。 AI绘图很吃GPU性能,硬件不够力可考虑用Google Colab云端跑。 操作系统: Windows 11 22H2 CPU: Intel i5-7400 GPU: Nvidia GTX1050 Ti 4GB RAM: 16GB 准备至少10GB的硬盘空间 Stable Diffusion WebUI版本:dfeee (2023/3/13) 2. 下载Stable Diffusion的模型 模型是AI绘图的重要依据,档案很大所以建议先下载。 绘图用的模型可以一次安装很多个。 HuggingFace和Civitai有很多类别可以下载,看要画真人还是动漫风格,至少需要下载一个模型。 点进下载模型的链接,选择下载扩展名为或的模型。 后者因不具备执行代码的能力因此的安全。 .ckpt.safetensors 这里推荐一些Ivon综合个人以及网络上的意见觉得不错的模型。 2.1. 写实风模型 Stable Diffusion v2.1,简称SD,是CompVis与合作团队发表的原始模型,适合画真人、动物、自然、科技、建筑的图像,亦学习过历史上许多画家的画风。 Chilloutmix写实风格的模型,适合画出2.5次元,融合日韩真人与动漫风格的图像。 Deliberate基于SD-1.5模型,适合绘制精致写实风格的人物、动物、自然风景。 2.2. 动漫风模型 Anything v4.5适合画动漫图,作者宣称不需要打一堆提示词也能出漂亮的图。 Waifu Diffusion v1.4是纯粹使用Danbooru图库训练而成,适合画动漫图。 Hentai Diffusion适合画动漫图,模型已使用大量负向提示词训练过以排除不良结果,另提供embeddings方便绘图时使用。 DreamShaper是基于SD-1.5模型,绘制精细动漫人物与油画风格的模型。 OrangeMix3,混合多种风格的动漫绘图模型,偏写实。 3. 安装Stable Diffusion WebUI 3.1. 安装Git和Python 请确认电脑已经安装最新版的GPU驱动程序。 Nvidia GPU用这个检查,里面含有CUDA。 下载Git版本管理工具。 至Git for Windows下载安装文件,一直下一步即可。 接着安装Python。 根据Wiki,Stable Diffusion WebUI限定Python版本需为。 请至Python官网下载的64位安装文件。 3.10.6Python 3.10.6 安装前务必勾选,将Python加到环境变量。 再按。 Add Python 3.10 to PATHInstall Now (进阶) 如果你熟悉Python开发的话,改用Anaconda设定Python虚拟环境会更好。 3.2. 复制Stable Diffusion WebUI存储库 打开档案总管,在桌面文件夹按右键+Shift,点击或。 如果你C槽空间不足的话,也可以切换到其他硬盘文件夹再开启终端机。 在這裡開啟Powershell終端機視窗 输入以下指令,检查目前Python版本,输出应为3.10.6 1 python --version 输入以下指令复制Stable Diffusion WebUI的存储库。 复制完成后保持终端机开着。 1 git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git 复制完成后,桌面会多出文件夹。 将刚刚下载的模型文件放到文件夹。 这个文件夹可放入多个模型文件。 stable-diffusion-webui.ckptmodels\Stable-diffusion.ckpt 3.3. 设定启动参数 GPU芯片为英伟达且VRAM大于8GB的可跳过此步骤。 根据Wiki,有些GPU需要修改启动参数才能正常启动WebUI。 对文件夹里面的按右键,以记事本开启,编辑这一行后面的启动引数。 (看不到.bat请点击文件管理视图 → 显示/隐藏 → 显示扩展名) stable-diffusion-webuiwebui-user.batCOMMANDLINE_ARGS= 若GPU VRAM小于等于4GB的话加入参数。COMMANDLINE_ARGS=--medvram --opt-split-attention 电脑RAM小于8GB的话改加入参数。COMMANDLINE_ARGS=--lowvram --opt-split-attention 顺带一提,加入引数可进一步减少VRAM使用量; 加入或引数则会产生一组网址,让你可以从外部网络访问WebUI。--xformers--listen--share 3.4. 启动Stable Diffusion WebUI 回到终端,输入以下指令启动WebUI: 1 2 cd stable-diffusion-webui ./webui-user.bat 初次启动会下载依赖套件,大概要等个30分钟安装。 如果在此步骤遇到错误,请先看常见问题。 启动完成后会显示一组网址。 执行程序时请勿关闭终端。 用浏览器开启:就可进入图形界面了。 执行程序时请勿关闭终端,执行时若出错终端也会输出讯息。 http://127.0.0.1:7860 要关闭Stable Diffusion WebUI,在终端机按Ctrl+C终止,再关闭窗口。 日后要启动Stable Diffusion,对文件夹里面的按二下即可 (不需要用系统管理员执行)。webui-user.bat 3.5. 如何更新Stable Diffusion WebUI Stable Diffusion WebUI项目源代码是托管在Github,开发迭代速度很快,建议每周适时更新程序。 但更新频繁也代表功能容易损坏,因此安全的更新方式如下: 在Stable Diffusion WebUI的文件夹里面按右键+SHIFT开启终端机,取得目前分支,会印出一组五位数代码 1 git rev-parse --short HEAD 接着拉取最新分支,更新到最新版档案。 1 git pull 如果更新后出现的讯息,请按键,输入退出即可。Merge branch 'master' ofEsc:q! 更新后如果有功能坏掉就退回之前的分支版本。 1 git checkout "分支代碼" 4. Stable Diffusion WebUI使用情况 在装好Stable Didffusion WebUI后,日后对文件夹里面的按二下就可以启动了。webui-user.bat 本节介绍Stable Didffusion WebUI的几个基本功能。 4.1. Stable Diffusion提示词基本教学 不论用哪个模式画画,Stable Diffusion都是吃「正向」与「负向」提示词(prompt,通俗的讲法叫关键词、咒语),并且要用英文输入。 正向提示词告诉AI要画哪些东西,负向提示词则是告诉AI不要画哪些东西。 提示词可包含某位画家的名字,AI会尝试模仿其风格。 当然也可以画特定动漫人物的「二创」,只要将名字和作品名称打上去就可以了。 你可以用英文写个句子描述图内场景,或是用提示词配合括号控制权重(括号越多权重越高),并且将想看到的提示词排在前面。 但提示词并非越多越好,正向提示词以不超过150个字为原则。 若使用的是Stable Diffusion的模型请看Voldy整理的艺术家名字。 若使用动漫风的模型请参看Danbooru Artist图库的标签决定要下哪些提示词,Civitai亦有很多搭配特定模型的提示词可以学习。 懒人包如下,假设要随机画一个Fate/Grand Order的贞德,裸体不拘。 正向提示词,注明角色名称作品名称、风格、身体特征。 1 jeanne d'arc from fate grand order, girl, (best quality), (masterpiece), (high detail), ((full face)), sharp, ((looking at viewer)), ((detailed pupils)), (thick thighs), (((full body))), (large breasts), vagina, nude, nipples 接着输入负向提示词,防止画出断手断脚的图。 当然也可以把不要出现的加进去,例如防止画出包含兵器在内的图片。military 1 lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts,signature, watermark, username, blurry, artist name 4.2. 文生图 Text to image 文生图txt2image即为让AI按照文字叙述绘图。 Stable Diffusion WebUI正上方可看到现在使用的是哪个模型。 切换模型约需要等30秒。 在页面上方填入正向与负向提示词。 右边有存档按钮。 Sampling Methods各种方法得出的结果都不一样,建议先试试Euler A,再试试DDIM,并试着调整Sampling Steps的值至30以上。 x则是输出图片的尺寸,尺寸越大质量越好,但越吃效能。 可用的长宽比请参考此表WidthHeight 建议勾选左下角的Restore faces,改善脸部绘制效果。 脸部模型默认是用CoderFormer,欲换成GFPGAN请按上方Settings→Face restoration切换,再按Apply Settings套用。 点右上角的Generate开始绘图。 视显卡性能而定,约一分钟图片就会算出来了,点选放大存档。 左下角有的数值可设定一次算多张图。 Batch count 如果对此次结果满意,不妨将Seed保存下来供日后利用,这样可以一定程度保留风格。 杂项:是算出类似地板花纹一样可连续的图片; 可以把图片的画质提升; 代表的是绘图与你给的提示词的相关度,数值越高越会按照你说的内容下去绘图。TilingHires_fixCFG_Scale 不论图片有无储存,Stable Diffusion算好的图都会自动储存在程序文件夹下的文件夹。outputs 4.3. 图生图 Image to image 图生图img2img是让AI参照现有的图片绘图,举例来说,你可以上传一张真人照片,让AI把他画成动漫人物。 点击框框上传图片。 图片比例需要跟设定绘制的长宽一致,例如512×512就得上传长宽1:1比例的图片。 同样填入正负向提示词,勾选Restore faces,再点击右上角Generate绘图。 图生图左下方有与这二个数值,决定与原图的相似程度。 越小与原图越相似,可用来微调图片。 CFG ScaleDenoising strengthDenoising strength 右上角的则是上传图片后,用Danbooru图库资料判别图片并自动填入提示词,这样你会对下提示词更有概念。Interrogate Deepboooru 4.4. 内补绘制 Inpaint 内补绘制是指将涂黑的区域让AI填充的技术,例如给图片的角色换衣服。 或是反过来:让AI把图片空白的地方绘制完成(outpaint)。 上传图片,点击图片,用鼠标将要替换的部份涂黑。 假设要换成泳装,那么就在正向提示词加入或这类的提示词。swimsuitbikini 左下角的有几个选项,即为填充新内容,则是在填充内容的时候参考原图黑色底下的内容。Masked contentfilloriginal 点击Generate绘图。 4.5. 用LoRA绘制特定人物画风 除了根据需求切换ckpt模型外,也可以额外叠几层网络改善画风,并改善绘制特定对象、角色的准确度。 例如使用Anything模型绘图,再搭配“Taiwan-doll-likeness LoRA”就能转成真人风格而不用依赖许多提示词,并且可以一次叠很多个,就像套多层滤镜一般。 跟ckpt大模型比起来,这类模型档案都很小,主要用来微调现有的模型。 小模型有Embedding、HyperNetwork、LoRA三种,副档名以或结尾,目前最热门的为“LoRA”。 更棒的是因为档案小,自行训练喜欢的人物模型成本并不高(见第6节)。.pt.safetensors 4.5.1. 安装小模型 Civitai有很多小模型可以下载。 下载时需注意模型是哪一种。 Embedding请放文件夹下的stable-diffusion-webuiembeddings HyperNetwork放到。stable-diffusion-webui\models\hypernetworks LoRA放到。stable-diffusion-webui\models\Lora 如果要显示小模型缩图,将图片取跟该模型一样的文件名,并放到该模型的目录。 例如在所在的目录放一张。Taiwan-doll-likeness.safetensorsTaiwan-doll-likeness.png 4.5.2. 小模型使用方法 进入WebUI,点击右上角Show extra networks 这样就会出现菜单。 以LoRA为例,点击小模型的卡片便会将其加到提示词字段,表示要在绘图时使用LoRA。 接着再加上其他提示词,绘图即会有使用LoRA的风格。 如果画出来的图片太诡异,可以调整提示词字段每个LoRA后面的数字,控制权重。 嗯,这样看起来好些了。 5. 扩充功能 Extensions Stable Difussion WebUI的Extensions页面能安装扩充功能,在绘图的时候整合其他AI技术,或是简化操作。 大部分扩充功能都能从图形界面安装,点击就会列出可下载安装的扩展功能。 Load from: 针对WebUI设计的扩充功能非常多,请看Wiki了解,本节介绍一些比较有趣的。 【点击展开】 6. 训练自己的模型 Training 警告:跟绘图不同,训练模型至少需要10GB的VRAM,也就是RTX3060等级以上的GPU。 训练自己的小模型有很多好处,例如可以在现有模型的基础上,让AI懂得如何绘制更精确的风格或者特定角色。 训练小模型的具体步骤请看这篇:Stable Diffusion模型训练教学 7.延伸阅读 Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2022). High-resolution image synthesis with latent diffusion models. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 10684-10695). Stable Diffusion web UI Wiki – GitHub r/StableDiffusion – Reddit Voldy Retard Guide The definitive Stable Diffusion experience ™ Stable Diffusion WebUI – 标签- 萌芽二次元 – 萌芽网页 Stable Diffusion – 话题 – 知乎 8. Stable Diffusion WebUI常见问题 这里列出一些安装时常见的错误讯息,你也可以到Discussion或是ATOMATIC1111储存库的Issue查看别人遇过的错误讯息。 无法解决再附上你的操作系统版本、Python版本、GPU型号至文章下面的留言板发问。 No module named pip → 于文件夹开启终端机,执行安装pip,删除文件夹,重新执行stable-diffusion-webuipython3 -m ensurepipvenvwebui-user.bat 因為檔案包含病毒或潛在的垃圾軟體,所以作業未順利完成。 → 误判,暂时关闭Windows Defender之类的防毒软件,再删除文件夹,重新执行。venvwebui-user.bat RuntimeError: Couldn't install torch. →几个可能: 确认Python版本为3.10.6,不可从微软商店安装。 并确认是否有安装最新GPU驱动。 防毒软件挡住。 非Nvidia GPU用户也可能遇到此错误,于的加入引数跳过检测。webui-user.batCOMMANDLINE_ARGS--skip-torch-cuda-test Recv failure: Connection was reset → 网络问题,好发于中国用户,因为GFW对Github的连接干扰导致下载失败。 需要换个代理才能正常连接。 OSError: [Errno 28] No space left on device → 硬盘或暂存文件夹没空间了,清出空间后,删除stable-diffusion-webui里面的venv文件夹,再重新执行webui-user.bat重装。 RuntimeError: CUDA Out of memory →GPU VRAM不足。 请在的后面加入或引数,降低VRAM使用量。webui-uset.batCOMMANDLINE_ARGS--mdevram--lowvram 127.0.0.1拒絕連線 → 请确认终端是否还开着。 或是网址改用试试,或是用记事本开启,确认里面有无这一行。http://localhost:7860C:\Windows\System32\drivers\etc\hosts127.0.0.1 localhost 温馨提示:本站提供的一切软件、教程和内容信息都来自网络收集整理,仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负,版权争议与本站无关。用户必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解! 大YIWU普通 打赏 收藏 海报 链接