#ComfyUI で AIポートレート＆AI動画作成 #StableDiffusion #LCM #StableVideoDiffusion

ComfyUI - 個人 - Microsoft Edge 2024_02_17 7_41_42

OpenAIがテキストから最長１分の動画を作成できる生成AIモデル「Sora」を発表して話題になっていますね。

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024

このクオリティには驚きましたが、悪用等色々問題を生む可能性があるので、しばらくはその検討のためにリリースされないようです。

今、簡単にAI動画を楽しむ方法としては、Runway gen-2、Pika、Stable Video Diffusionなど色々ありますが、ローカルで無料で楽しめるStable Video DiffusionをComfyUIで使ってみました。

ComfyUI - 個人 - Microsoft Edge 2024_02_16 21_04_17

ComfyUIはStable Diffusionを使うUIとして、Stable Diffusion web UIとともに人気のUIです。ワークフローベースなのでとっつきにくいですが、ある程度理解できるとカスタマイズ性等優れていて便利ですね。
今となってはかなり貧弱ですが、NVIDIA RTX2060搭載のWindowsノートパソコンにインストールしてみました。

詳しいインストール方法は色々記事があるので、ポイントだけ書いておきます。
・ComfyUIのInstallingのWindowsの欄に書いてある方法でとりあえず簡単に動く
・モデルやVAEなどを配置（またはStable Diffusion web UIと共有）
・NVIDIAのドライバーやCUDAなどは最新化しておく（エラーの原因の一つがこれでした）
・ComfyUI Managerを入れると拡張機能の導入が簡単に（これをはじめ知らずに拡張してました…）
・Stable Video Diffusion(SVD)をインストール
・SVDのモデルをダウンロードして配置
　（1.1のモデルが出ているのですがメモリ不足で動かなかったので、1.0のfp16のモデルをとりあえず使用しました）
・ComfyUI VideoHelperSuite(様々なビデオ形式に対応), Frame Interpolation(フレーム補間), Workspace Manager – Comfyspace(ワークフロー管理)もインストール