宝马男拒交停车费Stable Diffusion怎么安装在电脑上,本篇文章不做介绍,大家可以自己去找找如何在电脑上安装Stable Diffusion
选显卡的时候,主要看算力和显存。其中,显存的重要性主要体现在以下两个方面:
我在用的显卡是 RTX 3070 8G,应对本文的训练场景够用了。我在网上找到了一张“常见显卡 AI 跑图性能、性价比表”,供大家参考:
然后,就可以安装 Kohya_ss 版本的 LoRA(ya_ss)了。如果你想安装在电脑上某个特定位置,先在地址栏处敲击【cmd】,回车,你会进入这样一个命令窗:
在执行【accelerate config】后,它将询问一些设置选项,请按照以下选项依次选择:
如图,文件夹的名字叫【Kohya】, 点进去后可以看到一个叫【kohya_ss】的文件夹。
我们还需要新建一个文件夹,比如【Lora Training Data】用来存放后续要用的训练数据。
可见,AI 能学习到大致风格,模特穿着也像样,但没法还原花纹和细节。因为单张图片能提供的信息有限。所以,我们应该尽量给出衣服在各个角度的图像。
插播一句,图像的清晰度会直接影响到训练的质量,如果图片不够清晰,我一般会先用 Topaz Gigapixel 这类 AI 修复工具将它先放大处理。
再插播一句,为了让 AI 更有针对性地捕捉和学习到目标对象,我还会裁剪图片,尽量剪掉不必要的画面,让目标单品更显眼。
我们回到【Lora Training Data】文件夹中,在里面创建一个新文件夹,随便命名,我起的是【dongwumaozi】(动物帽子),然后在其中创建 3 个子文件夹,依次是【image】、【log】和【model】,如图:
接着,你在【image】这个文件夹里,再创建一个文件夹,格式是【数字_训练的概念】,【数字】指的是图片会被训练多少遍,我写了【100】(100 是默认训练次数,经试用,我觉得效果都不错),AI 就会把我每张照片训练 100 遍:
接下来,我们要打开 kohya 脚本。到【kohya_ss】这个文件夹里,找到【gui.bat】这个运行文件。
回到【image】文件夹后,就能看到和图片名称对应的 txt 文本描述了。如果你对机器标注的效果不太满意,打开 txt 文档手动修改,保存即可。
目前在训练服装 LoRA 上,我感觉默认的训练参数效果已经很好,所以并没有再做额外的更改、调整。如果你对训练参数的设置感兴趣,可以去看看 Kohya 脚本的官方教程(youtube.com/watch?v=k5imq01uvUY&t=1597s)。
在 3070 上,训练时长差不多在 30 分钟左右,出去跑个步或者冲个澡,模型就训练好啦!
一般默认参数训练出来的 LoRA 大小在 9 M 左右,在【model】这个文件夹里可以找到。
最后的最后,将 LoRA 文件拷贝到【stable-diffusion-webui】的【models】文件夹里对应的【LoRA】文件夹处,再次重启 WebUI,点选出对应的 LoRA 后,写好关键词就可以生成“淘宝模特”图了:
以上图片皆由该 LoRA 生成。拿最后一张图举例,我提供以下关键词,供你参考:
另外,也可以输入一些常用的负向关键词,比如“bad hands”等,让 AI 消除这种生成可能。
虽然在生成“动物帽子”这个案例中,喂 3 张图就有不错的效果,但如果你的目标单品版型、材质都较为复杂,可能得备上 5 到 30 张不同角度的图,才能更好还原。
就我个人而言,比起 AI 模特,我在买衣服时更希望看真人试穿,因为这样材质和版型才更有参加价值。
不过,未来我可能会训练一个自己的模型,然后再去叠加服装的模型,看自己的试穿效果。
还在上学那会儿,我看日剧《校对女孩河野悦子》,剧里石原里美饰演的主角将不同服装搭配剪下来再贴在一起,以此寻找灵感。那时,我觉得时尚编辑就像是魔法师。而现在,AI 给了我更多创造的机会。
电商模特、虚拟时尚博主、服装设计师的灵感助手……AI 还有更多可被激发的潜力。
现在涌现的这些 AI,就像是一摊墨水,所有人似乎都可以来蘸一蘸,然后写下一些特别的字迹。
|