这篇帖子是一些偶像打歌服服饰合辑
This post is a collection of some idol costume.
FLUX Version: [Flux.1 D][Realistic] Idol costume | 偶像打歌服
触发词/Trigger word:
请参考各个版本的说明
Please refer to the description ('About this version') of each version
建议使用adetailer或者sd-face-editor来改善面部。例图使用了adetailer来修缮面部。
It is recommended to use adetailer or sd-face-editor to improve the face. The example pictures use adetailer to imporove the face.
诚挚邀请您尝试此LORA,作者很希望能得到您的反馈和建议。如果您能分享您生成的美图就更好了。感谢~
Sincerely invite you to try this Lora. I am eager for your feedback and comment. It would be great if you can share the beautiful images generated by this lora. Thanks~
Description
触发词/Trigger words:
idol clothes,dress,collared dress,jacket,cropped jacket,short sleeves,bowtie,bow,buttons,hat,beret
FAQ
Comments (5)
老师,您的LORA训练的非常好,有几个关于您训练的问题想问一下,希望能不吝赐教:
①您每个LORA训练集里面都有一个5_1girl 文件夹,请问里面是什么图片呢,有何作用?
②我要训练衣服,能找到的衣服的原始图片一般都很少,我看您衣服训练集里的图片都有好几十张,请问是对原始图片做了什么处理吗?比如将衣服按照上半身下半身分割什么的
③请问您对于衣服原始图片的处理的流程一般是什么样的,需要抠脸抠背景吗?
你好,感谢喜欢。不敢赐教,大家交流交流
① 我这个文件夹里面放的是几十张由ai生成出来和训练集不同服装的图片。
最开始我是用正则训练,假如我给正则的文件夹起名5_1girl,最后出来看lora信息的时候感觉好像正则就是把正则文件夹里面的图片用1girl标签训练了若干次。
那我就想何不把这个过程变得更可控一点。比如我要练的是dress,我就生成了一堆穿牛仔裤,t-shirt的图片,然后给这些图片全部打上详细的标签,比如1girl、jeans、t-shirt。然后丢到主训练集而不是正则文件夹里面。有点差异的图片让学习的时候知道啥是1girl,啥是jeans,啥是我要的dress。然后出图的时候给1girl,dress不给jeans理论上就是我想要的结果了。
我姑且称之为手动正则吧,我也不知道这样理解正不正确,但是出来效果还行就一直这么做了。如果理解有误请大佬指正。
② 我也试过5张、10张训练,但是练出来的lora再出图的时候感觉人物姿势、角度有点被训练集框柱了,只能出训练集有的姿势。可能有点过拟合了,但是减少训练次数或者学习率出来的服装又不太像或者细节没出来。
也想过在上面的5_1girl里面放点hands up,arms behind back之类的。效果也有但是也不太可控。可能有时候刚好训练次数和学习率达到了那个玄学标准出来效果不错。但是这个度有点难把握.....
所以我自己感觉还是假如训练集是不同人、不同角度穿同一套衣服出来的效果是最好的。但是这种训练集可遇不可求,有些我看着不错的衣服也想练,但是训练集太少出来效果一般就没发。
③ 我一般找了一堆图片,然后用了些py脚本来处理图片。大体步骤如下吧(有些步骤没啥用,纯粹自己强迫症)
1)全部转成png,重命名(没啥用)
2)用Transparent Background (https://github.com/plemeri/transparent-background) 把人物抠出来。能自动化还是自动化吧,自己抠图太累了。此时处理完的图片是透明背景的png。
我没抠脸,按上面说的,不同人脸我寄希望于训练的时候模型能知道1girl指的是啥,能知道差异化出来,知道我想要的是dress而不是1girl。我试过抠脸,然后就变成出图头身比例很奇怪后来就没扣了。我感觉反正出图都是要adetailer的,把脸练进去了影响不大。5_1girl里面的图会一定情况下避免模型出来你训练集里面的人脸吧。
3)打开photoshop,对每一张图片处理:
1.检查背景有没有没抠干净的,能救的就救一下,不行的就算了。
2.按固定比例裁剪图片,把人物放到合适的位置,多余杂边裁掉。固定比例可以有多个,但是尽量不要太多。比如一套训练集里面3:4加16:9加4:3加9:16。最好不要自由比例裁切.
3.加上白色背景(或者黑色,打标的时候打对应就行)
4.限制长边缩放图片,比如ps可以把长边限制为768,短边自动按比例就缩小了。
以上3/4可以在ps里面搞个批处理,就不用每次都搞了
4)打标
5)用BooruDatasetTagManager(https://github.com/starik222/BooruDatasetTagManager) 检查并修改标签
6)粗略计算主训练集训练次数。我习惯是5_1girl的两倍左右(之前不记得哪里听到说正则是主训练的一半,就这么搞了)。比如5_1girl里面有50张图片,那就是5*50=250。假如我的训练图片有39张就是250/39*2约等于12或者13,没太大所谓,近似就行,心情好直接给15也行,玄学范畴了。那住训练集就是12_dress。这里指的是训练集命名的次数,到时训练再根据情况(玄学)给epoches和学习率咯。
7)开冲
大概就这些了,期待你也分享一些你的心得我们一起进步~
最近我準備做一個整合約50套動漫Idol 服裝的lora,剛好看到你的分享
好像茅塞頓開,發現了新世界(x)
我本身是訓練動漫人物,
一般會在單人lora 附帶5到10套打歌服, 最多的高達18套
而反常識的是, 我發現同時訓練服裝越多,
反而各服裝精確度(當然tag你得精確)和泛用性會有所提高,
導致後期就算我不想附加更多的服裝,也會加2-3套服裝去讓模型變的更好
之後我更會把不同的人物也放進去....似乎就是你所講的~把正則化乾脆學進主模型去
我學了一下把你的1girl方法引進後, 的確效果更理想了,不太出現1girl 被過污染的問題
https://github.com/john-mnz/ComfyUI-Inspyrenet-Rembg
在這裡順便分享一個我覺得是有史以來最強的自動去背插件,
比REMBG 和Transparent Background有更好的表現,動漫和真人的表現都很好
不過我還是會把透明批量轉換為白色背景, 不然邊緣有時候會有光暈效應
我覺得服裝訓練水很深,單是弄清楚tag 與衣物之間的關係就要花很多時間
尤其是大量的服裝是不對稱的, 難度就更高了
我也想問問大神 你在訓練服裝時,在LoRA Block Weight分層上有沒有什麼經驗可以分享?
@sheldonng 哇,好开心听到我的经验对你有帮助~
感谢分享工具,马上去试试!
分层我也没特别多心得,感觉很玄学,一时效果经验一时啥都不是。还没捉摸到特别有用的规律
illustriousxl all version pls
Details
Available On (1 platform)
Same model published on other platforms. May have additional downloads or version variants.



















