screencapture-127-0-0-1-7860-2023-09-04-21_39_19

次世代Stable Diffusion (SDXL)がリリースされてからしばらく経ちますが、8/31にリリースされたStable Diffusion web UI v1.6.0で、SDXLが便利に扱えるようになったので、その利用方法を紹介します(今までも使えないわけではなかったですが、かなり面倒でした)。
Stable Diffusion web UIについては、下記記事などを参考にして下さい。

Stable Diffusion web UIのアップデートはstable-diffusion-webuiフォルダでコマンドラインで下記を行うことで行うことができます。

git pull

SDXLのモデルは下記からダウンロードできます。SDXLは2段階で処理するようになって、前処理をbaseモデル、後処理をrefinerモデルで行います。VAEは必須では無いです。

ダウンロードしたモデルをmodels/Stable-diffusion、VAEをmodels/VAEに配置します。

screencapture-127-0-0-1-7860-2023-09-03-10_53_28

VAEはSettingsタブのVAEで設定することもできますし、

screencapture-127-0-0-1-7860-2023-09-04-19_55_31

v1.6.0からは、txt2imgタブのCheckpointsタブで、モデルを選んで右上の設定アイコンを押して出てくるポップアップで、Preferred VAEを設定することで、モデル読込み時に設定されるようになりました。

screencapture-127-0-0-1-7860-2023-09-03-11_08_23

Stable Diffusion checkpointで、sd_xl_base_1.0.safetensorsを選択。追加されたRefinerメニューで、sd_xl_refiner_1.0.safetensorsを選択します。Switch atは、どの段階でrefinerモデルに切り替えるかで、0.8だと全ステップの80%の段階で切り替えます。
Sampling methodも色々増えています。
SDXLは1024×1024で学習しているそうなので、サイズはこのあたりに設定したほうが良いです。ControlNetやLoraは現状使えないようです。

シンプルなプロンプトでもかなり良い感じの画像が生成されるようになりました。生成してみたサンプルを載せておきます。(画像の下にプロンプトを添えておきます)
汎用モデルなので、特化モデルには敵わない感じもしますが、SDXLベースの特化モデルも増えてくると思います。

(追記)こちらでSDXL用のControlNetやSDXLベースのチューニングモデル・マージモデルを紹介していますので、合わせて読んでね。

00009-1148139908
beautiful nature
00006-2158012040
cyberpank, future, car, city
00016-3718382713
beautiful asian girl, portrait, photo realistic
00013-1905516118
beautiful asian girl, portrait, cosplay, anime character
00001-3564913396
anime, girl
00004-3173758885
anime, girl
00005-2112401181
manga, girl
00006-2206870334
manga, girl
00010-3523374219
art, oil painting, girl
00008-894030471
art, oil painting, girl
00011-1220287441
art, ink painting, girl
00014-3817271513
art, ink painting, girl
00019-646528806
beautiful scenary, ink painting

色々が画風が簡単に生成できて良いですね。

前の記事のプロンプトと同じような感じで、少し複雑なプロンプトも試してみました。

00006-4032845817
beautiful girl, photorealistic, portrait, F1.4, Canon, full body, big breast, wet white shirts, school uniform, wet long hair, best quality, master piece, wind, rain, tears, back light, sparkling, night, concept art
Negative prompt: pool, ((umbrella))
00036-1001490180
beautiful girl, ((photorealistic)), portrait, F1.4, Canon, full body, big breast, wet white shirts, school uniform, wet long hair, best quality, master piece, wind, rain, tears, back light, sparkling, night, concept art, noize, film
Negative prompt: pool, ((umbrella)), ((painting)),CG

1件のコメント

  1. ピンバック: #StableDiffusion XL (#SDXL) の ControlNet や チューニングモデル・マージモデル を試してみました | Digital Life Innovator

  2. ピンバック: Apple M1 MacBook Pro LLM(GGUF)がGPUを使って高速に #ChatGPT #LLM #textgenerationwebui | Digital Life Innovator

  3. ピンバック: Macローカルで簡単にAI音楽生成 #AudioCraft #MusicGen #AudioGen #TTSGenerationWebUI | Digital Life Innovator

コメントは受け付けていません。