最新実写美少女モデル #BRAV5 とイラストモデル #AnythingV4 の併用による AIコスプレ写真と #DepthLib での手の補正 #StableDiffusion #LoRA #ControlNet #コスプレ

以前書いたStable DiffusionとLoRAを使ったAIコスプレ写真生成の記事を多く読んで頂いたので、アップデートした記事をサンプルと共に載せておきます。Stable DiffusionとLoRAを使うのは変わりませんが、実写モデルとして話題のBRAV5を、さらにControlNetを使って2次元画像から作る方法になります。

コンテンツ目次 [非表示]

1 BRA(Beautiful Realistic Asians) V5
2 Depth map library and poser で手を修正
3 ControlNet の canny で 2次元画像を真似した実写写真を生成

BRA(Beautiful Realistic Asians) V5

まずは、美しいアジア系女性写真で訓練された実写モデル「BRAV5」について。こちらはアジア系女性のポートレート写真を生成するにはかなり良い感じですね。モデルをダンロードして、Stable Diffusionのモデルフォルダに配置して、逆光ウエディングドレス姿のポートレート写真を生成してみたのを載せておきます。なかなか良い感じですね。プロンプトによるのかも知れませんが、比較的顔は似た感じになりますね。AIグラビア写真はプロンプトだけで簡単に生成できそうです。（指の表現は苦手そうです。）

Depth map library and poser で手を修正

ちょっと脱線しますが、Stable Diffusion web UIの拡張で、手がうまく描けずに試行錯誤する代わりにある程度こんな手を書いてと指示する方法が出てきました。拡張としてまずはControlNetをインストールします（詳細は下記記事を参照）

さらに、拡張として下記URLをExtensionsで指定して、Depth map library and poserをインストールします。

https://github.com/jexom/sd-webui-depth-lib.git

Apply and Restart UIをするとDepth Libraryというタブが現れます。

screencapture-127-0-0-1-30000-2023-05-17-17_01_44

Add background imageを押して修正したい画像を選びます。widthとheightを画像のサイズにします。

screencapture-127-0-0-1-30000-2023-05-17-18_22_46

Handsタブ内で描きたい手の形を選んでAddボタンを押すと右の画像に画像が現れるので、サイズを変えたり、回転・反転などして描きたい手の形に合わせて配置します。そしてSave PNGを押してPNGファイルに書き出します。

screencapture-127-0-0-1-30000-2023-05-17-18_25_27

生成時の画像やプロンプトをimg2imgまたはinpaintに持ってきて（PNG Infoに生成画像を入れてSend toするのが便利）、ControlNetをEnableに、ImageにさきほどのPNGファイルを読み込ませます。PreprocessorをnoneにModelをcontrol_depthにして画像を生成します。

これで思ったような手の形を描けます。とは言っても、あまりうまくいかないこともよくありますね。

ControlNet の canny で 2次元画像を真似した実写写真を生成

前回は実写モデルにLoRAを適用してコスプレ写真を生成しましたが、今回はまず2次元イラスト画像に特化したモデルにLoRAを適用して、2次元イラストを生成します。気に入ったイラストが出てきたら、それをControlNetのImageに設定して、Preprocessorをcanny、Modelをcontrol_cannyに設定、実写モデルに変更して、同じプロンプト、LoRAで画像を生成します。
Stable DiffusionでLoRAを使う方法は前回記事を参照して下さい。

2次元モデルとしてAnythingV4.5、実写モデルとしてBRAV5を使って前回と同じLoRA、プロンプトで様々なキャラクターのコスプレ写真を生成してみました。

最初に2次元画像を生成するのは、その方が服装やポーズなどがしっかりと反映されるからです。

screencapture-127-0-0-1-30000-2023-05-14-19_14_30

cannyを使うことで2次元画像の輪郭に合わせて画像が生成できるので、かなり良い感じになります。Weightは高すぎると無理やり2次元に合わせる感じになるので、0.35くらいに設定しました。色は2次元から引き継がれないし、輪郭線の解釈も元画像と違ったりしますが、何度か生成するかプロンプトを追加すれば良いですね。