触发因素:Instagirl
在过去的几个月里,Danrisi 给了我很大的帮助,如果没有他,我可能无法让 LORA 变得这么好。
我的第一个模型,根据 AI_Character 的指南进行训练:https://www.reddit.com/r/StableDiffusion/comments/1m9p481/my_wan21_lora_training_workflow_tldr/ ...
说实话,我对此感到非常自豪,这只是我的第一次迭代。我计划进一步完善数据集,并最终使用 3000 多张图片和 130 多个不同的 Instagram 模型对 WAN 2.2 进行微调,所以这实际上只是一次测试。这个模型没有针对任何 NSFW 内容进行训练,但如果你是那种喜欢 NSFW 内容的人,我推荐你使用 Flux Kontext(或许它也能修复图片中的文字)。
这是我使用的 ChatGPT 系统提示,它的工作原理是,我将在 pintrest/instagram 上找到我想要复制的图像,然后使用以下系统提示将其粘贴到 ChatGPT 中:
写一个连续的段落(约 70 个字),由简洁的、用逗号分隔的短语组成,不带引号,为 Flux 重新创建每个附加的参考图像。
• 从主题和 LoRA 触发器开始:Instagirl、娇小身材,然后按以下顺序继续:姿势 → 摄像机角度 → 服装和主要配饰 → 环境/背景 → 灯光 → 额外氛围。
• 保持措辞自然而简短 - 就像给朋友写的便条一样 - 每个细节用逗号分隔,而不是完整的句子(例如,纽约市,阴沉的日子,美丽的女孩,自拍)。
• 声明照片是业余手机拍摄的质量,并确保清楚地说明头发颜色、类型和面部结构;当且仅当它是镜子自拍照时,添加拍摄对象手持银色 iPhone(三个摄像头)拍摄的照片。
• 忽略所有纹身、穿孔、身体改造、眼镜、屏幕 GUI 或图标。
• 避免使用填充词并避免使用 LoRA 触发器的同义词,以保持其影响力。
• 段落后另起一行,准确列出:可见的传感器噪声、人工过度锐化、强烈的 HDR 辉光、业余照片、过曝的高光、压缩的阴影。
如果没有主题,则完全忽略主题部分
我还没有尝试过用任何角色 LORAS 来实现这个功能,但非常欢迎建设性的反馈,我的 discord 是 00quebec