【Stable Diffusion】クオリティ系プロンプトの比較

Stable Diffusion
この記事は約6分で読めます。

ポジティブプロンプトのbest qualityやmasterpiece、ネガティブプロンプトのworst quality、Textual InversionのEasyNegativeなど、おまじないとして何も考えずとりあえず入れておくクオリティ系プロンプト。
それぞれが、何に対してどのような影響があるのかを改めて比較してみます。
モデルデータによっても最適な重みは変わってきますが、一例としてご参考までに。

今回の比較では、僕が普段使っているプロンプトから「best quality」、「masterpiece」、「worst quality, low quality」、「EasyNegative」の4種を扱います。

デフォルト

今回は、モデルデータ「hassakuHentaiModel_v12」で比較します。

Prompt:

1girl, bikini

Negative Prompt:

(なし)

Steps: 20, Sampler: DDIM, CFG scale: 7, Seed: 179452698, Size: 512×512, Model hash: d3cd6ac55a, Model: animelike_hassakuHentaiModel_v12, Denoising strength: 0.7, Clip skip: 2, Version: v1.2.1, Hires upscale: 1.5, Hires upscaler: Latent

クオリティ系プロンプトが一切入っていないと、さすがに品質が低い結果になりました。
全体的に荒く、色合いや表情、構図やポージングも平坦で、質感などもほとんど表現されていないです。

best quality

モデルデータによっては推奨プロンプトに「masterpiece不要」「EasyNegative不要」とあったりする場合もありますが、best qualityは(リアル系も含めて)ほぼほぼすべてのモデルデータに共通して使用されています。

best qualityは、顔のパーツのバランスと、全体の構図の良さ(ポージングやアングル、背景の細かい要素など、画面内の要素の収まりの良さ)に影響しているようです。
強調すればするほど全体的に破綻する部分が増えていきますが、プロンプトで指定している「1girl, bikini」の部分は1.4あたりまでは構造をキープできています。
構図やポージングの良さと破綻しないラインを考えると、best qualityの重みは1.2~1.4あたりにしておくとよさそうです

masterpiece

日本語訳で「傑作」のmasterpiece、俗に言う「マスピ顔」(モデルデータによらず似通ったデザインの顔)になりやすいので、避ける人も多いらしいです。

masterpieceは、顔立ちのイラスト的な見栄えに加えて、人物がより魅力的に見えるポージングや構図になるプロンプトのようです。
1.8以降は構図がかなり破綻してしまっていますが、1.7までは、重みが増すほど、正方形の画面の中でいかに人物を魅力的に収めるか、が反映されています。
前述のマスピ顔のように、重みが増すほど画一的な表現になりやすい可能性もあるので、masterpieceの重みは0~1.4程度にしておくとよさそうです

worst quality, low quality

worst quality, low qualityはNegative Promptに記述するプロンプトです。
2つセットで記述されることが多いので一括して検証します。
個人的な感覚ですが、モデルデータの推奨プロンプトでは「(worst quality, low quality:1.4)」と指定されていることが多いように感じてます。

worst quality, low qualityは、人物や背景のディテール、質感に影響するようです。
また、構図やポージングも、胸やおしりが強調されて可愛さとえっちさが増してますが、重みが増してもほとんど変化はありません。
best qualityやmasterpieceと異なり、重みを2.0まで上げても破綻しませんでした。
Negative Promptは強調しても破綻しにくいようです。

1.8以降は構図が変わってしまっていますが、1.7まではほぼ同じ構図です。品質的にも、1.3あたりからはほとんど変化が見られません。
worst quality, lowqualityの重みは1.4程度にしておくとよさそうです。

EasyNegative

EasyNegativeは、Textual Inversionと呼ばれる、プロンプト詰め合わせのような機能を持つプロンプトの1つです。
EasyNegativeのデータ(EasyNegative.safetensors)をwebuiフォルダ直下のembeddingsフォルダに配置して、Negative Promptに「EasyNegative」と記述することで効果が反映されます。
一撃で人体の破綻を防いだり構図や質感のクオリティが上がる便利な機能ですが、こちらも「マスピ顔」に近い部分があり、EasyNegativeを使うことで似通ったデザインの顔立ちになりやすいデメリットもあります。

EasyNegativeは人体の破綻を防いだり構図や質感のクオリティに影響するプロンプトです。強調しすぎると絵柄そのものにも変化があり、1.7を超えると全体的に破綻してます。
強調無しでも十分な効果が見られ、1.2以降はさほどクオリティに変化がないです。
EasyNegativeの重みは0~1.2程度にしておくとよさそうです

クオリティ系プロンプトの組み合わせ

Negative Promptは「(worst quality, low quality:1.4), (EasyNegative:1.2)」に固定して、Positive Promptの「best quality」と「masterpiece」の重みの組み合わせを比較します。
前述の検証をもとに、best qualityの重みは1.2~1.4、masterpieceの重みは1~1.4の範囲で比較していきます

構図やポージングなどに若干の違いは出るものの、印象としてはどれもさほど変わりませんでした。
Negative Promptの指定で十分にクオリティの向上はされていると考えてよさそうです。

best qualityとmasterpieceを含まないパターンも掲載しておきます。

質感などがわずかに平坦な印象があるようにも感じますが、誤差の範囲かもしれません。

まとめ

Positive Prompt
best quality:1.0~1.2程度
masterpiece:0~1.2程度

Negative Prompt
worst quality, low quality:1.4程度
EasyNegative:0~1.2程度

「worst quality, lowquality」は強調しても破綻が起きにくいので少し強めに設定して、それ以外は若干のクオリティ向上を狙って1.2程度までに抑えておくのがよさそうです。

プロンプトを強調すればするほど、プロンプトを長くすればするほど破綻しやすくなりますし、過度に強調したところでその分だけクオリティが向上するわけでもないので、クオリティ系プロンプトは必要最小限にしておきましょう。
(「extremely awesome detailed shiny skin(非常に素晴らしく詳細な光沢のある肌)」のような指定は、質感などの向上を図れる可能性もあるのでこの限りではないです)

個人的には、Positive Promptに「(best quality:1.2), masterpiece」、Negative Promptに「(worst quality, low quality:1.4), (EasyNegative:1.2)」の組み合わせを使用していこうと思ってます。

最後に、改めてクオリティ系プロンプトなしのパターンと、上記の個人的に使用していく組み合わせのパターンの2枚を掲載しておきます。

コメント

タイトルとURLをコピーしました