Stable DiffusionとAI画像生成

私はAIを使って画像を生成するのが好きです。

そのきっかけは、「Stable Diffusion Web UI」というAI画像生成ツールを自分のノートパソコンにインストールしたことでしたが、実はこのツールを使い始めるまでには思った以上の苦労がありました。

今日は私が、「Stable Diffusion Web UI」を自力でインストールしたときの話をしたいと思います。

昨年ふと思い立って、自分のノートパソコンで「Stable Diffusion」を使えないかと考え、色々とインストール方法を調べながら、行き当たりばったりでインストールを始めてみました。

ただこれが予想以上に大変で、環境構築にものすごく時間がかかったのです。

というのも、「Stable Diffusion」を動かすには高性能なGPUが必要なのに、私のパソコンはCPUしか搭載していなかったため、ローカルで動かすには「UTOMATIC1111」や「Python」、「git」のインストールに加え、CPUでも使用できるように、プログラムを書き換える必要があったのですが、その作業中に何度もエラーメッセージが発生したからです。

プログラミングの知識もない私は、エラーメッセージが出るたびにネットで解決策を調べ、試行錯誤を繰り返しましたが、新しいエラーが次々と現れ、途中で何度も作業が止まってしまいました。

よく知りもしないまま「Stable Diffusion」のインストールを始めたことを何度も後悔しましたが、作業の途中でパソコンの電源を切ることもできず、焦りながらも徹夜で作業を続けました。

そしてついに、無事にインストールが完了し、実際に動作するかどうかを試すことができたのですが、当時は「プロンプト」というものの存在すら知らず、各設定項目の意味も理解していなかったので、最初はどのように画像を作ればよいのかさっぱりわかりませんでした。

それでも、試しに適当なプロンプトを入力して男性の画像を作ろうとしましたが、どう入力しても女性の画像ばかり生成されてしまいました。

「1 boy」や「1 man」など、明らかに男性を表す英単語を使っているにもかかわらず、結果はいつも女性の画像になるのです。

原因を調べてみると、「Stable Diffusion」などのAI画像生成ツールでは、学習データの関係で男性の画像が生成しにくいことがわかったのですが、プロンプトを工夫することで、なんとか女性画像ばかり生成される現象を防ぐことができるようになり、その後は自分好みの男性画像を作れるようになりました。

今では、LoRAを利用したり、生成モデルを使い分けたりして、かなり自由に画像を作成できるようになりましたが、それでも「Stable Diffusion」は、全身画像の生成が苦手だったり、CPUでの生成に時間がかかりすぎたりというデメリットがあったため、「Leonardo.Ai」や「SeaArt」、「Adobe Firefly」、「ChatGPT」など、他のAI画像生成ツールも併用するようになりました。

そして色々使ってみてわかったのですが、それぞれツールによって得意なジャンルがあったり、日本語入力に対応していたりしていなかったりするので、それ以降は、自分の目的に合わせてAI画像生成ツールを使うようになりました。

今では「Stable Diffusion」を使うことも少なくなりましたが、自作のLoRAを使えば、自分が作りたい画像により近づけることもできますし、オンラインでは作れない画像もローカル環境では生成することができますので、今でも「Stable Diffusion」は、私にとって大切なツールの１つとなっています。

もちろん、AIは完璧ではなく、思い通りの結果が得られないことも多いのですが、それでも「できない」と思っていたことを可能にする力があると感じています。

完璧でない人間とAIの力が組み合わさることで、今まで実現できなかったことができるようになることもあるのではないかと思っています。

これからもAIの助けを借りながら、自分では描けないような画像を作っていきたいと思います。

最後までお読みいただきありがとうございました。

世羅の気功と日常ブログ

「何もないと思っていた自分に、
小さな“できた”がくれた喜び」を
テーマに、気ままに想いのままに
書き綴るブログです。

Stable DiffusionとAI画像生成