【雑記】AI画像生成事始め - その後 | 元ダビスタ好きの独り言ブログ

元ダビスタ好きの独り言ブログ

個人的な出来事、PC、ゲーム、その他、適当に書き連ねます

相変わらず「Dragon's Dogma 2」を遊びつつ、他に何か無いかと探し回ってますw

 

ドグマ2の方は、竜結晶集めを延々していて、既に1500個ぐらい貯まったので、そろそろ装備を交換しようか悩み中だったりしますが、このゲームへの情熱が薄れつつあるので、真エンディング目指そうか検討中ですw

 

で、前の投稿で触れたAI画像生成の方は、旧式のコマンドプロンプトベースでの環境(これは、実際には内部的に使われてるので、仕組み的には変わって無いんですが)から、世に出回っているAI画像生成エンジン?を管理するフロントエンドのランチャー的なソフトである「Stabillity Matrix」と言うソフトを知ることが出来たので、それを使って「Stable Diffusion WebUI」や同じくStable Diffusionをベースとした「ComfyUI」を使って色々いじり倒してましたw

 

仕組みさえ判ってしまえば、そんなに難しいモノではなく、1日もあればこんな感じで画像が造れるようにはなります。

 

これは、モデル(生成する画像の人物の外観を決めるネタ元といったら良いのですかね?w)と呼ばれるファイルをディズニー&ピクサー風の絵を作成出来るものをダウンロードして適用後作成した画像です。

 

AI画像生成は、基本的にテキスト(プロンプト)から絵を作成するというのが基本の流れになっているのですが(画像から作ることも出来ますし、画像のポーズだけを抜き取って別の人物像に割り当てる等も出来ます)、そのテキストに指定した単語や文章を解析して、それに準じた画像を作るというものなのですが(他にも、画像から画像を作り出すみたいな仕組みも組み込まれています)、モデルを色々変える事で、こういう3D CGI風の画像や、よりリアルな人物の画像を作り出せるというのが一般的なようです。

 

他にも色々あるんですが(常に完璧な画像が出来るわけではないので、それらを修正するツールや手法等色々出てきています...指が4本しかない、あるいは指が6本有る、みたいな化け物画像が比較的多く生成されたりしますんで、それを修正するツールとかねw)、そのへんは自分で触ってみるのが一番早いですね。それなりに高性能(特にGPU)なPCが必要という面がネックではありますが・・・。

※本当は、横で初期化状態のクリーンな環境を持ったまま眠ってるASUSのゲーミングPCで試そうと思ったんですが、VRAMが8GBなのと、GPUがモバイル版GT1070なのが条件に合わないので、諦めましたw

 

思ったのは、上述したモデル関連のファイルとかを色々調べると、やっぱり権利関係めんどくさいよなぁ、ってなった事でした。私みたいに、個人で楽しむ?程度なら、そこまで気にする必要はないですが(こうやって公のブログに画像をあげてるのも、気にする必要はあるとは思いますがw)、これを使って何か利益の出るような事を始めようとすると、結講グレーな部分も多いのかな?と思いました。まだまだ成長途上の技術だとは思うので、その辺はこれからなんでしょうけども。

 

結局、自分で納得出来る画像(それってどんな画像?w)を出すには、数打ちゃ当たる作戦になるのかな?と言う気がしてます。画像生成時にシード値(乱数生成のネタ元となる数値)をランダムにするんですが、それが違うだけでも生成される画像のお顔とかは好みが分かれますしね。

 

何度も何度も画像生成しているわけですが、そもそも理想の画像のイメージを持ってないし、単なるあら探し(今回は指おかしいなぁとか、顔のバランス悪いなぁとか、その程度しか考えないw)するだけの作業になるため、前も書きましたが、「これ、何が楽しいの?」と思うことが多いですけど、そこはポケモンの孵化厳選と同じで、「無になって作業する」感覚なんだと思いましたw

 

ここ2日ばかり触った感想としては・・・。

 

作ってる本人も「俺は何してんだ?」となってるので、このAI画像生成という作業になんらかの目的や目標を設定するのは難しいなぁと、性癖とか含めて人によりけりだと思いましたw

 

ま、満足はしたので、この辺でよいかなぁ、と思っていますw

 

追記:

上で「Stabillity Matrix」について触れていますが、パッケージマネージャとしては優秀なフロントエンド・ソフトなんですが、そもそも「Stable~WebUI」(互換性のあるStable~Forgeは少し状況が異なりますが)は、Extension(機能拡張=Photoshopのplug-insみたいなもの...といっても大分違いますが😅)、有りきで使うソフト(これらも、ある意味Stable DiffusionというPythonで作成されたAI学習フレームワーク?のフロントエンドなんですけどねもね)なので、「Stable~」とそれら便利なExtension群は、それぞれでバージョン管理やアップデートがされている側面があります(個人の趣味で作り始めたのも有りますしね)。なので、「Stable~WebUI」のバージョンが上がると、Extensionとの互換性がなくなることも多い印象です。実際、今日(2004/4/7も、「Stable~WebUI」が、GitHubのプロジェクトからpullされるバージョンが上がっており(1.9.0RCとのこと)、アプデしようものなら、結果Extensionが動かなくなると言うような事も起きています(私は、もう弄ることもないので、修復する努力はしませんけども、アンインストールして、再度インストールする際にバージョン指定をすれば使えるようにはなりますw)。