saya in AI・ロボット先進技術写真・カメラ

#StableDiffusion で実写風女性画像生成に適したモデル3選とモデルのマージ #ControlNet による姿勢の指定に便利な openpose-editor

Stable Diffusion web UIを使って、アニメ風2次元画像の生成は色々やってきましたが、実写写真風の女性ポートレートはどこまでできるのか色々な学習済みモデルを使ってみました。また、先日、ControlNetを使った姿勢指定を紹介しましたが、openposeの姿勢認識を修正できるopenpose-editorもインストールして使ってみましたので、紹介したいと思います。

コンテンツ目次

1 Cafe Instagram
2 Hyperanatomy MegaMerge
3 Analog Diffusion
4 モデルのマージ
5 ControlNetの姿勢を編集できるOpenPose Editor
6 姿勢を指定してみた例

Cafe Instagram

まずはこちらの記事でも紹介したcafe-instagram-sd-1-5-v6（instagram-latest-plus-clip-v6e1_50000）。とても日本人女性の顔などの生成クオリティが高い感じです。姿勢や手足などは少し苦手で変な感じになることも。
https://huggingface.co/cafeai/cafe-instagram-sd-1-5-v6

Hyperanatomy MegaMerge

HassanBlend、PFG、PurePornPlusの3つをマージした人間の描写に適したモデルです。NSFW（Not safe for work）なアダルト系画像を含めて学習しているので、そういった画像も生成しがちなので要注意です。でも、そのおかげか手足や肌や姿勢の表現がリアルです。
ただし少し絵画感のあるのっぺりとした画像が生成されることが多い感じですね。
https://civitai.com/models/3241/hyperanatomy-megamerge
（モデルのダウンロードにはCivitaiのユーザ登録が必要です）

Analog Diffusion

アナログ写真を学習したモデル。プロンプトにanalog styleを追加して使います。写真ならではの美しいポートレート写真を生成できます。日本人より海外の人の方が得意な感じ？良い画像を生成するためのプロンプトが少しむずかしいです。
https://huggingface.co/wavymulder/Analog-Diffusion

モデルのマージ

Hyperanatomy MegaMerge自体もそうでしたが、学習済みモデルはマージすることができます。Stable Diffusion web UIでは、Checkpoint Mergerタブで、Primery model(A), Secondary model(B)を選んでMultiplierにBの比率を指定して、”Merge”ボタンを押すだけ。簡単ですね。
モデルをマージすることで、モデルの特徴が混じり合うことで、より良くなったり悪くなったりします。

上記の3つのモデルをマージしてみました。

0.7(0.7(instagram-latest-plus-clip-v6e1_50000) + 0.3(hyperanatomy_MegamergeV1)) + 0.3(analog-diffusion-1.0)

上記はかなりうまく生成したもののみ載せていますが、2次元画像と比べるとあまり成功確率は高くなく変な画像が生成されるので、ガチャを引く感じで。たまに下記のように心霊写真みたいな面白い画像も生成されますよ。

ControlNetの姿勢を編集できるOpenPose Editor

下記記事でControlNetを使った画像による姿勢の指定を紹介しましたが、openposeを使った場合、画像からの姿勢の認識を間違えることがあります。

分かりづらいですが、姿勢の認識がうまくいっていない例

openposeの姿勢を編集できる拡張機能としてopenpose-editorというのが公開されています。
インストールするには”Extensions”タブの”Install from URL”の”URL for extension’s git repository”に下記を入力して、”Install”ボタンを押します。
https://github.com/fkunn1326/openpose-editor.git