【Stable Diffusion】モデル(Model)とは何か?お勧めのモデル:Check pointやChillout Mixのインストール方法や違いまとめ|モデルとチェックポイントの違い, checkpoint

Stable diffusion stability ai |Photoone(フォトーン) stable diffusion

画像AIソフトの中でも1番自由度が高く、しかも無料で使うことができるソフトの1つに「Stable Diffusion」があります。

Stable Diffusionを使う上でものすごく重要な要素に「Model(モデル)」があります。ここでは、モデルとは何か?お勧めのモデルやモデルの追加方法についてまとめています。


Model モデルとは何か? ~モデルの重要性~

Stable Diffusionにおけるモデルとは画像生成する際に使用する機械学習済みのファイルのことを言います。

人間も数学に強い人やスポーツに強い人、コミュニケーションに強い人など様々な能力に特化した人がいるように、AIもすべてのことに万能なわけではありません。AIに何を学習させたかによってできることが異なります。

画像生成AIの世界においては、画像を生成するといっても様々なニーズがあります。例えば、実写に近い画像、2Dアニメのような画像、3Dアニメのような画像、3Dで美男・美女のような画像を作成するなどニーズは様々です。

そのときに、それぞれのニーズに特化した画像生成の元となる学習済みファイルがモデルです。

例えば、3D実写の画像を生成したいときに、2Dアニメに特化したモデルを使って画像を生成すると、「ウソでしょ、、何これ、、全然使い物にならないじゃん」という画像が生成されたりまします。

例えばこんなのが生成されたりします。もはや恐怖です。


こういった恐ろしい事態を招かないためにもモデルは非常に重要なのです。(もちろん、モデルだけではなく、画像生成時のprompt(プロンプト)も重要です)


チェックポイント(Checkpoint)|モデルとチェックポイントの違い

Stable Diffusionでモデルと同じぐらいかそれ以上に頻出する単語に「Checkpoint(チェックポイント)」があります。

とても簡単に言うと「モデル(model)」=「チェックポイント(checkpoint)」という認識で問題ありません。

モデルとは機械学習における大本となるアルゴリズムのことです。モデルにたくさん画像を読み込ませたりすることで学習していきます。

チェックポイントはモデルが学習しているある時点のことです。

例えば、ABCというモデルが画像10枚を学習した状態と、画像1000枚を学習した状態では同じモデルですが、習熟度は異なります。このように各モデルにおける学習の習熟度のようなものがチェックポイントです。

Stable Diffusionでは画像生成のモデルとしてチェックポイントをインストールします。



デフォルトのモデル(チェックポイント)

もちろんStable Diffusionにはデフォルトでモデル(チェックポイント)が用意されています。現時点では「v1-5-pruned-emaonly.safetensors」というものです。


これは人(実写、アニメ含め)を生成するには向いているとは言いずらいモデル(チェックポイント)です。


モデルはどこにあるか?(チェックポイントをダウンロードする場所)

Stable Diffusionのモデルはかなり優秀なものが無料で公開されています。モデルをどこからダウンロードすればいいかというと、お勧めのモデルのほとんどが次の2つのサイト(コミュニティー)の中にあります。

Stable Diffusionのモデルが置いてあるコミュニティー


なお、それぞれが完全に独立しているわけではありません。ある同じモデルをCivitaiでもHaging Faceでもどちらでもダウンロードできる場合もあります。


Civitai(シビタイ)

CivitaiはStable Diffusionで使えるモデルが無料でダウンロードできるサイトです。


上部メニューをクリックするとCheckpoint(チェックポイント)とRoLA(ローラ)が表示されます。

(参考)RoLAとは何か?

RoLAとは何か?Checkpointとの違いなどについては下記をご参考ください。

【Stable Diffusion】LoRAとは何か?CheckpointとLoRAの違いと使い方


アニメっぽい画像から、実写、2Dや3Dなど様々なモデルがあります。どのモデルでどのような画像が生成されるかもサイト内で確認することができます。


また、モデルだけでなく、どういいたプロンプト(要件)で生成したかも確認することができます(記述がない場合もあります)。AI画像生成のお手本となるような素晴らしいサイトです。



Haging Face(ハギング フェース)

Haging Face(ハギング フェース)は機械学習のモデルをまとめているサイトです。Stable Diffusionのモデルだけに特化しているわけではありません。ありとあらゆるたくさんのモデルをダウンロードすることができます。


モデルは上部の検索窓でモデル名を指定することもできますし、「Model」を選択することでHgging Faceで利用できるモデルの一覧を確認することもできます。


例えば、「Models」から入り、「Stable Diffusion」と検索すると約2000ぐらいのモデルがヒットします。(※Stable DiffusionだけでなくStable Video Diffusionなど他のアプリケーションのモデルも含まれています)


モデルを選択すると詳細を確認することができます。


モデル(チェックポイント)をダウンロードする場合は「Files and versions」をクリックします。するとファイルの一覧が表示されます。


この中に、チェックポイントであるファイルがあります。拡張子は「.ckpt」か「.safetensors」です。どちらもある場合は「.safetensors」の方を選択します。こちらの方がセキュリティ的に安全です


おすすめのモデル(チェックポイント)

Stable Diffusionでおすすめのモデル(チェックポイント)をいくつか紹介します。

おすすめのモデル(チェックポイント)
  1. Chillout Mix
  2. ForgeSaga Landscape



ChilloutMixのインストール

アジア系の写真寄り(アニメではない)美少女系の画像を生成するモデルにChilloutMix(チルアウト ミックス)というものがあります。

これは日本人のTASUKU様が作成したモデルです。このモデルの配布はCivitaiのみでHagging faceにはありません。


ダウンロードリンク

Civitaiで「ChilloutMix」と検索しても表示されないので、こちらのリンクをたどってください。



ライセンスの確認

ダウンロード前に右下にあるライセンスを確認してください。



例)ライセンス

Chilloutmixのライセンスは以下のようになっています。

This model permits users to:
✕ Use the model without crediting the creator
✕ Sell images they generate
✕ Run on services that generate images for money
✕ Run on Civitai

✓ Share merges using this model
✕ Sell this model or merges using this model
✕ Have different permissions when sharing merges

 ↓ 日本語


このモデルにより、ユーザーは次のことが可能になります。
✕ 作成者のクレジットを表示せずにモデルを使用する
✕ 生成した画像を販売する ✕ お金を払って画像を生成するサービスを実行する
✕ Civitai で実行
✓ このモデルを使用してマージを共有します
✕ このモデルを売却するか、このモデルを使用して統合します
✕ マージを共有するときに異なる権限を与える



ファイルをModelsフォルダに配置する

ライセンスを確認したら右上のダウンロードボタンをクリックします。3.9GBあるのでなかなかの重さです。

ファイルがダウンロードできたら、これを「stable-diffusion > stable-diffusion-webui >models >Stable-diffusion」のフォルダに入れます。


VAEのダウンロードは不要

なお、このチェックポイントはVAEの使用が推奨という文言が表示されています。

This checkpoint recommends a VAE, download and place it in the VAE folder.の「VAE」というテキストがリンクになっていて、クリックするとVAEをダウンロードすることができます。

(この表示がないチェックポイントはVAEが内蔵されていたりするので、VAEをダウンロードすることは不要です)

ところが、このリンク経由でダウンロードしたVAEはチェックポイントと同じファイルです。これは、このバージョンのChilloutMixの最新版にはVAEが搭載されたため、別でダウンロードする必要がなくなったことを示しています。


Stable Diffusionを起動する

modelsのStable-diffusion配下にモデルを設置したら、Stable Diffusionを起動します。

すると上部のchekpointの一覧に「chilloutmix」が追加されています。



これで、ChilloutMixを使って画像を生成する準備が整いました。とても簡単ですね。


画像を生成する

画像生成の準備が整ったら、プロンプトを記述して生成をします。

ここでは例として次のようなpromptとnegative promptを記述しました。

prompt

(RAW photo, best quality), (realistic, photo-realistic:1.3), masterpiece, an extremely delicate and beautiful, extremely detailed, CG, unity, 8k, amazing, finely detail, ultra-detailed, highres, absurdres, soft light, (black hair, short hair, curly hair, messy hair, bangs), beautiful detailed girl, detailed fingers, extremely detailed eyes and face, beautiful detailed nose, beautiful detailed eyes, (light on face), looking at viewer, (closed mouth:1.2), 1girl, cute, young, mature face, pale skin, (half body:1.3, sitting), (medium breasts), realistic face, realistic body, beautiful detailed thigh, (ulzzang-6500-v1.1:0.6), , (white shirt, collared shirt, lace, black miniskirt, pantyhose, detached sleeves, bowtie), , (semi smile:1.3), (aegyo sal:1), (kpop idol:1), relaxed,

Negative prompt

paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, glans, extra fingers, fewer fingers, ((watermark:2)), (white letters:1), (multi nipples), bad anatomy, bad hands, text, error, missing fingers, missing arms, missing legs, extra digit, fewer digits, cropped, worst quality, jpeg artifacts, signature, watermark, username, bad feet, {Multiple people}, blurry, poorly drawn hands, poorly drawn face, mutation, deformed, extra limbs, extra arms, extra legs, malformed limbs, fused fingers, too many fingers, long neck, cross-eyed, mutated hands, polar lowres, bad body, bad proportions, gross proportions, wrong feet bottom render, abdominal stretch, briefs, knickers, kecks, thong, {{fused fingers}}, {{bad body}}, bad-picture-chill-75v, ng_deepnegative_v1_75t, EasyNegative, bad proportion body to legs, wrong toes, extra toes, missing toes, weird toes, 2 body, 2 pussy, 2 upper, 2 lower, 2 head, 3 hand, 3 feet, extra long leg, super long leg, mirrored image, mirrored noise, (bad_prompt_version2:0.8), aged up, old, heavy makeup, bad-hands-5, long hair, medium hair, cleavage, nude, naked, open mouth,

Steps: 30, Sampler: DPM++ SDE Karras, CFG scale: 8, Seed: 3612744720, Size: 512×1024, Model hash: fc2511737a, Model: chilloutmix_NiPrunedFp32Fix, Denoising strength: 0.4, Clip skip: 2, Hires upscale: 1.5, Hires upscaler: Remacri 4x



生成された画像のクオリティもなかなかのものです。



ForgeSaga Landscape

ForgeSaga Landscapeは素晴らしい風景を生み出してくれるチェックポイントです。こちらもCivitaiのForgeSaga Landscapeのページからダウンロードすることができます。


ファイルがダウンロードできたら、これを「stable-diffusion > stable-diffusion-webui >models >Stable-diffusion」のフォルダに入れます。


Stable Diffusionを起動する

modelsのStable-diffusion配下にモデルを設置したら、Stable Diffusionを起動します。既に起動済みの場合はリフレッシュアイコンをクリックします。

すると先ほど追加したForgeSaga Landscapeが表示されます。


画像を生成する

画像生成の準備が整ったら、プロンプトを記述して生成をします。

ここでは例として次のようなpromptとnegative promptを記述しました。

prompt

farcry5,mountains,cliffs,forest,trees,pine trees,stones,rocks,bushes,grass,scenery,nature,sky background,clouds in the sky,haze in the background,wide angle,hills,boulders,midday,landscape,path,trail,Extreme long shot,Medium wide shot,realistic shaded lighting,photorealism,sunny day, by oprisco,

Negative prompt

fcNeg-neg, worst quality, low quality, easynegative, verybadimagenegative_v1.3,

Steps: 30, Sampler: DPM++ SDE Karras, CFG scale: 8, Seed: 3612744720, Size: 512×1024, Model hash: fc2511737a, Model: chilloutmix_NiPrunedFp32Fix, Denoising strength: 0.4, Clip skip: 2, Hires upscale: 1.5, Hires upscaler: Remacri 4x


まあまあな画像が生成されました。



チェックポイントはかなり敷居が低く、ファイルのダウンロードも実際に使用するのもとても簡単です。

世の中にはかなりの数のチェックポイントが配布されているため、ぜひ最適なものを見つけてみてください。




コメント

タイトルとURLをコピーしました