画像生成AIに思った通りの姿勢の画像を出力させるのに、プロンプトで指示するのはとても難しかったのですが、画像で簡単に指示できるようになりました。img2imgを使う手もあったのですが、近い感じの画像を出力するので姿勢だけを指示するというのは難しかったので良いですね。

Stable Diffusion web UIにControlNetをインストール

screencapture-127-0-0-1-30000-2023-02-17-21_17_41

Stable Diffusion web UIのExtensionsタブで”Install from URL”を選んで”URL for extension’s git repository”に下記URLを入力して”Install”ボタンを押します。
https://github.com/Mikubill/sd-webui-controlnet.git

screencapture-127-0-0-1-30000-2023-02-17-21_18_43

インストールが完了したら、”Installed”を選び、”Apply and restart UI”ボタンを押します。

さらに、下記よりControlNet用のモデルをダウンロードします。control_openpose-fp16.safetensorsだけでも良いですが、他のモデルも入れておくと良いかも。

https://huggingface.co/webui/ControlNet-modules-safetensors/tree/main

  1. canny:輪郭検出アルゴリズムを使用するモデル
  2. depth:画像の深度情報を元に画像生成を行うモデル
  3. hed:色変更やスタイル設定に適したモデル
  4. mlsd:直線的な輪郭の検出アルゴリズムを使用するモデル
  5. normal:法線マップ(ノーマルマップ)を使用するモデル
  6. openpose:ポーズ検出を使って画像生成を行うモデル
  7. scribble:落書きを元に画像生成を行うモデル
  8. seg:セマンティックセグメンテーションを使用するモデル

ダウンロードしたら、stable diffusion web UI配下の”extensions/sd-webui-controlnet/models“フォルダに入れます。

ControlNetの使い方

screencapture-127-0-0-1-30000-2023-02-17-21_50_33

txt2imgやimg2imgタブで、ControlNetの◀を押して展開します。
Enableにチェックを入れて、Processorと対応するModelを設定します。
 canny と control_canny-fp16.safetensors
 openposeやopenpose_hand と control_openpose-fp16.safetensors
Imageのところに姿勢の参考になる画像を入れます。

46311448411_6907982ec2_c

この画像でcannyで輪郭抽出して絵を描くと

03335-790123229-angel in the light, white dress, wing, masterpiece, best quality

こんな感じに。img2imgよりは形に忠実に、その他はあまり引っ張られない感じですね。
背景があると背景の形も指示した感じになります。

03336-4135284968-angel in the light, night, masterpiece, best quality

openposeを使うと、画像から姿勢(関節等)の情報を抽出して絵を描いてくれます。

03337-3765571428-angel in the light, night, masterpiece, best quality

姿勢以外はプロンプトで指示した感じになります。

03338-2676016288-angel in the light, night, masterpiece, best quality
screencapture-127-0-0-1-30000-2023-02-17-22_15_17

別の画像でも。openposeの例。

03365-1142225586-pin-up model, idol, chair, masterpiece, best quality

cannyの例。

03361-1301714016-pin-up model, idol, chair, masterpiece, best quality

openposeを使ってモーション模写に再チャレンジ

以前、img2imgを使って、人の動きを模写できるかチャレンジしてみましたが、かなり難しい感じでした。

今回、ControlNetのopenposeを使って同じ画像を使って生成してみたのがこちら。

動きはかなりそれっぽくなりました(一部姿勢の検出が間違っているところもありますが)。
ただ、やはり顔や服装の一貫性を持たせるのが一番難しい感じです。(プロンプトでなるべく変わりにくいものを指示するのと、seedを固定すると同じような絵になりやすいですが。)

03426-2481628271-18 years old hatsune miku, white t-shirt, black pants, running, black background, masterpiece, best quality
03427-2481628271-18 years old hatsune miku, white t-shirt, black pants, running, black background, masterpiece, best quality
03428-2481628271-18 years old hatsune miku, white t-shirt, black pants, running, black background, masterpiece, best quality
03429-2481628271-18 years old hatsune miku, white t-shirt, black pants, running, black background, masterpiece, best quality
03430-2481628271-18 years old hatsune miku, white t-shirt, black pants, running, black background, masterpiece, best quality
03431-2481628271-18 years old hatsune miku, white t-shirt, black pants, running, black background, masterpiece, best quality
03432-2481628271-18 years old hatsune miku, white t-shirt, black pants, running, black background, masterpiece, best quality
03433-2481628271-18 years old hatsune miku, white t-shirt, black pants, running, black background, masterpiece, best quality

もう一つ、かなり以前に撮影させていただいた動画からも生成してみました。

服装はフレームごとにコロコロ変わっていますが、姿勢は連続性がある感じで面白いですね。
(元画像が姿勢の認識が難しい画像なので、間違いも多いのですが)

03465-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03466-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03467-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03469-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03470-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03471-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03472-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03473-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03474-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03475-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03476-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03477-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03478-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03479-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03480-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03481-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03482-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03483-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality
03484-2030801829-cute girl , red and white japanese shrine dress, dance,  white hair, white background,, masterpiece, best quality

(追記) 下記記事で、openposeの骨格モデルを編集できるOpenPose Editorや、実写風画像の生成について書きましたので合わせてご覧ください。

1件のコメント

  1. ピンバック: #StableDiffusion で 実写風女性画像生成に適したモデル3選 と モデルのマージ #ControlNet による姿勢の指定に便利な openpose-editor | Digital Life Innovator

  2. ピンバック: 最新実写美少女モデル #BRAV5 と イラストモデル #AnythingV4 の併用による AIコスプレ写真 と #DepthLib での手の補正 #StableDiffusion #LoRA #ControlNet #コスプレ | Digital Life Innovator

  3. ピンバック: Stable Diffusion の mov2mov で AI動画作成 #StableDiffusion #mov2mov #ControlNet | Digital Life Innovator

  4. ピンバック: 2023年の振り返り | Digital Life Innovator

コメントは受け付けていません。