最新のStable Diffusion XLをやってみたいけども、いろいろ複雑なものは難しい…
そんな方にお勧めの画像生成AIのソフトの紹介とインストール方法です。
Fooocusとは
Fooocusは、オフラインで動作するオープンソース(無料)の画像生成ソフトウェア。
人気画像生成AIの新バージョンであるStable Diffusion XL(SDXL)を簡単に利用できるのが特徴!
複雑な調整をしなくても、プロンプト(呪文)の入力をするだけでハイクオリティな画像が作れるソフトです。
Stable DiffusionとMidjourneyのいいとこどりのツールだニャ!
Fooocusの利用料金
オープンソースなので無料です。
ローカル環境で動かすなら完全無料ニャ!
Google Colabで動かしたい場合は、別途そちらの料金がかかるニャ!
Fooocusのインストール方法
Google Colab環境とローカル環境へのインストールの2つがあります。
今回はローカル環境へインストールします。
システム要件として、4GB以上のNvidia GPUが必要ニャ!
Fooocusをダウンロードする
Githubで公開されているのでそこからダウンロードします
https://github.com/lllyasviel/Fooocus
リンクを開くとこんなページが開きます
ページの中ほどに、「>>> Click here to download <<<」(ダウンロードするにはここをクリックしてください)と書かれた場所があるので、そこをクリックしてファイルをダウンロードします
クリックすると、ファイルがダウンロードされます。
ファイルを解凍する
ダウンロードしたファイルをお好みの場所で解凍してください。
解凍する場所はどこでもいいニャ!
でも日本語名が途中にあるとエラーが出るかもニャ!
ファイルは7zip形式で圧縮されているので解凍ソフトがない場合は、以下のリンクからダウンロードしておいてください。
ファイルを解凍すると、「run.bat」が入っているのでそれを実行します
初回はmodelデータのダウンロードで時間がかかるニャ!
成功するとこんな画面が出てきます
Fooocusを使ってみる
Fooocusの画面構成
Fooocusの画面構成は以下の通りとってもシンプルです。
Fooocusで画像を生成する
さっそくプロンプトを入れて画像を生成してみます。
今回は「1boy,anime」と入れてみました。
出てきた結果がこちら。
画像が2枚生成されました。
どこかの街みたいなシーンですね。
これでFooocusのダウンロードから画像生成まで完了です!
おまけ
Fooocusの下に「Advanced」と「Input Image」のチェックボックスがあります。
これらにチェック入れると細かい設定ができるようになります。
FooocusのAdvanced設定
デフォルトでは2枚画像が生成されましたが、これらの設定は、下にある「Advanced」にチェックを入れると設定画面が開いて変更できます。
やらなくても問題ないですが、画像サイズ、枚数、スタイルは設定しておいたほうが便利です!
Setting
一番最初の画面はsettingです。画像のサイズや枚数などが設定できます
上から順に
・performance:スピード重視かクオリティ重視か?
・Aspect Ratios:画像の解像度
・Image Number:出力する枚数
・Negative Prompt:ネガティブプロンプト
・Random:シード値。チェックボックスからチェックを外すとシード値が設定できます
となっています。
Style
2番目のタブは「Style」です。
デフォルトでは「Fooocus V2」と「Default (Slightly Cinematic)」にチェックが入っています
これらは最初から組み込まれているスタイルです。
スタイル一覧は以下のGoogleSheetで公開されています。
…記事作成時点で187行目まであるニャ!!?
Model
3つ目のタブは「Model」。
これはSDXLに対応したLoRAを設定できるところになります。
…LoRAは著作権回りが怪しすぎて個人的には使いどころが難しいニャ…
生成AI系は全部著作権回りは微妙だけどもLoRAは特にだニャ
Advanced
最後は「Advanced」
基本的にはFooocus はデフォルトで最適な構成を自動化しているのでこの項目は無視して問題ないです。
シャープネスやStable Diffusion コミュニティの CFG スケールなどの細かい設定ができるニャ!
興味があったら調べてみるニャ!
FooocusのInput Image設定
Advancedの隣に「Input Image」というチェックボックスがあります。
チェックを入れると別の設定が表示されます
Upscale or Variation
これはMidjourneyのツールをベースにしたものになっています。
画像をドロップして、その画像をもとにアップスケールをしたりできます
使い方は以下のドキュメントを参考にしてください
https://github.com/lllyasviel/Fooocus/discussions/390
Image Prompt
文字通り画像をベースに画像を生成します。
テキストと組み合わせることもできます
こちらも詳細は以下の公式ドキュメントを見てみてください
https://github.com/lllyasviel/Fooocus/discussions/557
Inpaint or Outpaint (beta)
Midjourney の「左/右/上/下」矢印に似たインペイントとアウトペイント機能です。
画像から余分なものを消したり、逆に書き足したりできます
これも詳細は公式へ…すみません
https://github.com/lllyasviel/Fooocus/discussions/414
これで設定項目も以上です!
基本的には呪文の入力に全力集中できるシンプルなツールだニャ!
コメント