肩こりの現実逃避？画像生成AIに浮気してみた話

最近、ホビーロボットの設計でFreeCADばかり触っていて、肩も首もバキバキ…。

「ちょっと現実逃避したいなあ」と思って立ち寄った本屋で、目を引いたのが――

> 『画像生成AI Stable Diffusion スタートガイド』

表紙には元気そうな女の子キャラ。

正直、それまで画像生成AIにはあまり興味がなかったんですが、気づけばレジへ直行。

なんというか、勢いって怖いですね。

意外とおもしろかったです。

Google Colab Proを使えば、自分の環境でも導入できそうなのもポイント高い。

特にイラストが好きな人にはかなりオススメできる内容でした。

ChatGPTさんも「萌え絵ならStable Diffusion一択」と言ってたのを思い出しました。

プロンプトを英語で書かないといけないのはちょっと大変そう（※個人の感想です）が、

「画風を指定できる」「細かい指示が通る」など、ツールとしての自由度は高い印象。

今まで使ってきたChatGPTなどとどう違うのか？という点も気になって調べてみました。

ざっくり分けると、以下の2タイプがあるようです。

テキスト生成AIが画像生成AIを操作するタイプ

　→ ChatGPTやGeminiなどがこれ。指示をテキストで与えると、画像生成AIに投げてくれる。

画像生成機能が内蔵されているタイプ

　→ 一部のアプリやGrokさんがそう。プロンプトを直接入力して画像を出力。

実際に、本に載っていたプロンプトを参考にしながら、画像生成AI用に次のようなプロンプトを用意してみました。

> ファンタジー風のアニメ絵で鮮やかな色使いの絵で、１人の銀髪ロングヘヤーの女の子が長めの黒いローブを着て、黒いブーツを履いて、大きな魔女の帽子をかぶって花畑に体操座りしながら微笑みながらコチラを見ている。晴れて遠くに城が見える。

このプロンプトを使って、GeminiさんとGrokさんに画像を生成してもらいました。

Geminiさんの作品

Grokさんの作品

ChatGPTさんの作品

ChatGPTさんだけは、下のプロンプトを入れて再学習する必要があります。

追加プロンプト

ネットで最近のファンタジーとアニメ絵を調べてから、次のプロンプトで絵を描いて下さい。

また画像出力が混雑しますので、リトライは辛いです。それに、ChatGPTさん曰く「萌え絵はちょっと苦手」とのことでした。

画像生成AI、思っていた以上に面白かったです。

僕はどちらかというと「図面を描く派」なので、これ以上ハマるとFreeCADに戻れなくなりそう。

というわけで、ほどほどにして設計作業に戻ります。

でも、イラストが趣味の方や、自分のイメージをビジュアルにしてみたい人には、

Stable Diffusionはかなり魅力的なツールだと思いました。

興味があれば、気分転換がてら試してみるのもアリかも？