Stable diffusionで画像生成する | こそこそなにするもの

こそこそなにするもの

ニート脱却の為、もがきあがくことこそ生命の本質…                                       

 

Stable diffusionで画像生成する方法

 

ざっくり流れだけ紹介します。

このブログはAIの文章を元に作成しています。ブログ作成の練習中です。爆  笑

 

 

  1.プラットフォーム

 

Stable diffusionをPCに環境構築するには、いくつかの方法がありますが、ここでは代表的な2つの方法を紹介します。

 

  • 1つ目の方法は、PythonとGitというソフトウェアをインストールし、Stable diffusion Web UIというプログラムをダウンロードして実行する方法です。この方法は、自分のPCのグラフィックボードを利用して画像を生成できるため、高速に動作します。ただし、グラフィックボードがない場合や性能が低い場合は、画像の品質やサイズに制限があります。また、PythonやGitのインストールや設定に手間がかかる場合もあります。
 
  • 2つ目の方法は、Google Cloud Platformというクラウドサービスを利用して、仮想的なPCにStable diffusion Web UIを構築する方法です。この方法は、グラフィックボードが自分のPCになくても、クラウド上で高性能なハードウェアを借りて画像を生成できるため、高品質や大きな画像が作れます。ただし、クラウドサービスは有料であり、料金がかかります。また、クラウドサービスの設定や操作に慣れる必要があります。

 

どちらの方法もメリットとデメリットがありますので、自分の目的や環境に合わせて選択してください。

 

 

  2.モデルの入手

 

Stable diffusionのモデルは、インターネット上でダウンロードできます。

  • Civitai: このサイトでは、モデルごとに生成された画像がサムネイルで表示されており、気に入ったものを選んでダウンロードできます。また、LoRAと呼ばれる追加学習ファイルもあります。LoRAは、モデルに特定の要素を追加することで、より多様な画像を生成できるようにするものです。
  • Hugging Face: このサイトでは、モデルがテキスト形式で一覧されており、検索機能を使って目的のモデルを探すことができます。こちらのサイトにもLoRAがあります。

 

実写系とイラスト系に分けておすすめを3つずつ紹介します。

実写系のおすすめモデルは以下の通りです。
 

✅ BRA v6 

 アジア人の女性をリアルに描くことができます。顔や髪型、服装などのバリエーションが豊富で、自然な表情やポーズも生成できます。商用利用は禁止されています。
 

✅ ChilloutMix

 アジア人の女性を得意とするモデルです。BRA v6よりも柔らかい雰囲気の画像が生成できます。背景や小物などの細部にもこだわっています。商用利用は禁止されています。
 

✅ AbyssOrangeMix2

 人物だけでなく、動物や風景なども描くことができます。色彩や陰影が美しく、幻想的な画像が生成できます。商用利用は許可されています。


イラスト系のおすすめモデルは以下の通りです。
 

✅ BreakDomainRealistic

 とてもハイクオリティなイラストを生成することができます。エッジやテクスチャが鮮明で、かっこいい画像が生成できます。商用利用は許可されています。
 

✅ DefmixV2

 アニメ風のイラストを生成することができます。キャラクターの表情や髪型、服装などが多彩で、可愛らしい画像が生成できます。商用利用は許可されています。
 

✅ PastelMix

 パステルカラーのイラストを生成することができます。柔らかい色合いとふんわりした雰囲気が特徴です。背景や小物なども描くことができます。商用利用は許可されています。
 

 

  3.画像の拡大

 

 解像度だけを上げると構図が崩れたり、人物が異形のものになったりするのでもう一手間加える必要があります。

 

 一つは、Hires.fixやTile Diffusionなどの機能を利用することです。これらの機能は、画像を高解像度化・高画質化するためのツールです。Hires.fixは、画像のエッジやテクスチャを保持しながら拡大することができます。Tile Diffusionは、画像をタイル状に分割して、それぞれにStable Diffusionを適用することで、より細かいディテールを生成することができます。

 もう一つの方法は、txt2imghdというテクニックを使って、より大きな画像を生成することです。txt2imghdでは、以下のような手順で画像を拡大します。
- txt2imgを用いて画像を生成する
- Real-ESRGANなどの超解像技術を用いて画像を拡大する
- 拡大した画像を細かく分割し、1枚ずつimg2imgで綺麗にする
- 綺麗になった画像を結合する

この方法では、Stable Diffusionだけでは生成できないような大きな画像を作ることができます。ただし、この方法は時間がかかる場合がありますのでご注意ください。

どちらの方法もメリットとデメリットがありますので、自分の目的や好みに合わせて選択してください。