言葉じゃなくて絵で画像生成AIに姿勢を指示できるように #StableDiffusion web UI の ControlNet 拡張

画像生成AIに思った通りの姿勢の画像を出力させるのに、プロンプトで指示するのはとても難しかったのですが、画像で簡単に指示できるようになりました。img2imgを使う手もあったのですが、近い感じの画像を出力するので姿勢だけを指示するというのは難しかったので良いですね。

コンテンツ目次 [非表示]

1 Stable Diffusion web UIにControlNetをインストール
2 ControlNetの使い方
3 openposeを使ってモーション模写に再チャレンジ

Stable Diffusion web UIにControlNetをインストール

screencapture-127-0-0-1-30000-2023-02-17-21_17_41

Stable Diffusion web UIのExtensionsタブで”Install from URL”を選んで”URL for extension’s git repository”に下記URLを入力して”Install”ボタンを押します。
https://github.com/Mikubill/sd-webui-controlnet.git

screencapture-127-0-0-1-30000-2023-02-17-21_18_43

インストールが完了したら、”Installed”を選び、”Apply and restart UI”ボタンを押します。

さらに、下記よりControlNet用のモデルをダウンロードします。control_openpose-fp16.safetensorsだけでも良いですが、他のモデルも入れておくと良いかも。

https://huggingface.co/webui/ControlNet-modules-safetensors/tree/main

canny：輪郭検出アルゴリズムを使用するモデル
depth：画像の深度情報を元に画像生成を行うモデル
hed：色変更やスタイル設定に適したモデル
mlsd：直線的な輪郭の検出アルゴリズムを使用するモデル
normal：法線マップ（ノーマルマップ）を使用するモデル
openpose：ポーズ検出を使って画像生成を行うモデル
scribble：落書きを元に画像生成を行うモデル
seg：セマンティックセグメンテーションを使用するモデル

ダウンロードしたら、stable diffusion web UI配下の”extensions/sd-webui-controlnet/models“フォルダに入れます。

ControlNetの使い方

screencapture-127-0-0-1-30000-2023-02-17-21_50_33

txt2imgやimg2imgタブで、ControlNetの◀を押して展開します。
Enableにチェックを入れて、Processorと対応するModelを設定します。
　canny と control_canny-fp16.safetensors
　openposeやopenpose_hand と control_openpose-fp16.safetensors
Imageのところに姿勢の参考になる画像を入れます。