The English description is translated below the Japanese one at DeepL.
重度の厨二病患者である四国めたんのLoRAです。
トリガーワードは shikoku metan, voicevox です。
先に作ったずんだもんと比較すると正面からの絵以外が無いので動きが鈍いです。それならと重みを下げると再現性薄くなるので blue eyes, pink hair, long sleeves, long hair, blush stickers, white dress, twintails, puffy sleeves, frills, twin drills, maid headdress,heart hair ornament を入れると服の細かな形状以外は安定します。
重みはAnimagine版は0.5前後、Pony版は0.6前後推奨。
Animagine版はAnimagine XL 3.1をベースとして学習していますが3.0でも動作は確認しています。それ以外のXLモデルでは正常に機能しない可能性があります。
Pony版はPonyDiffusionV6XLをベースとして学習しているのでそれ以外のPony派生モデルでは正常に機能しない可能性があります。
以下翻訳
This is LoRA of Shikoku Metan, a severely kitchen sick person.
Trigger words : shikoku metan, voicevox
Compared to Zundamon, which I made earlier, it has no other pictures than the front view, so it moves slower. If we lower the weights, the reproducibility will be less, so we will use blue eyes, pink hair, long sleeves, long hair, blush stickers, white dress, twintails, puffy sleeves, frills, twin drills, maid, and a heart hair ornament. headdress,heart hair ornament will be stable except for the detailed shape of the clothes.
We recommend a weight of around 0.5 for the Animagine version and 0.6 for the Pony version.
The Animagine version is based on Animagine XL 3.1, but we have confirmed that it works with 3.0 as well. Other XL models may not function properly.
Pony version is trained based on PonyDiffusionV6XL and may not work properly with other Pony derived models.
Description
FAQ
Comments (2)
プロンプトについて少し気になった点を…
WebUIの説明ページには書いてあるのですが、LoRAを適用するための記述(<>付きのテキスト)は、プロンプトがCLIP(テキストデコーダー)に渡される前に文中から取り除かれる仕様になっています。なので、<lora::>を置く位置がプロンプト内のどこであっても出てくる画像は変わりません。
そして、つまり<lora::>がそっくり抜き取られてしまうということは、例えばプロンプトが
1girl, <lora:metan_pony_v1:0.6>,solo
等の場合、実際にCLIPに渡されているテキストは、
1girl, ,solo
に変わっているということになります。
これは、プロンプトの目的が1girlとsoloの間にはっきりとした隔たり・区切りを意図しているのならいいのですが、普通はそうではない。なので、この仕様に気付いていない場合、ここを境にプロンプトが強く前半と後半に分かれてしまう、かのような現象が起こります。
SDの性質上、このアクシデントがかえって良い生成結果を及ぼす可能性もあります。ですが、少なくともここに何が起こっているのかを把握していた方が、その後の記述をどう調整するかにも方針が立てやすいと思われるため、念のため報告差し上げました。
また、<lora::>がCLIPに渡されないという前提を踏まえた上で
1girl, ,solo
1girl,,solo
1girl,solo
の3つは全て別の結果を返します。
これは、",," が1トークンの別単語として扱われるためです。間にスペースを挟むと、2つの "," トークンとして解釈されるため、トークンカウントが1つ増えます。
ついでに、これは個人的な好みにもよるかもしれませんが…
プロンプトの末尾にカンマをつけて締めるのは、構図関係のリソースをいくらか破棄しているような感覚があります。
あくまで個人的な観察からの感想なので根拠はないのですが、大枠の絵の見え方を扱う「意味」をわざと破綻させることで、そこで浮いたぶんの仕事量を表面的な見栄えに回している、というふうな手応えを感じる。
なのでカンマを末尾に残すのは、最終的にはロスだと考えています。違うかもしれませんが。
普通に知らなかったのでありがとうございます。
Details
Files
Available On (1 platform)
Same model published on other platforms. May have additional downloads or version variants.







