■はじめに

Geminiの画像生成AIが「Imagen 3」から「Nano Banana」に進化しましたね。
普段はChatGPT(画像はDALL-E)をメインで使って、ブログのタイトル画像やまんがを作っています。

実はまんがを始める前に、ChatGPT・Gemini・Grokを比べたことがありました。
その時は「イラストの上手さはあっても、使い勝手はChatGPT一択」だったんです。

だからこそ今回のバージョンアップには、ちょっと期待大です。

■まずは小手調べ

前回の調査と同じプロンプトでお試し。

> ファンタジー風のアニメ絵で鮮やかな色使いの絵で、銀髪ロングの女の子が黒いローブとブーツを着て、大きな魔女の帽子をかぶり、花畑に体操座りして微笑んでいる。晴れて遠くに城が見える。

(生成画像がこちら)




結果は……魔女が大きく描かれていて好印象!
前作より確実に進化してますね。

■ChatGPTさんと比べてみる

「Imagen 3」のデータがないので、ChatGPTで描いたものと比較してみました。

まずは2コマまんが。



NanoBananaは背景の描き込みがしっかりしていて、ChatGPTより細かい印象。
ただ、まんが用に考えると「背景が濃いのは好みが分かれる」ところですね。

両者ともに苦手なのは“日本語の吹き出し”。
日本語を絵画扱いしてしまうのは、今後のAIに期待です。

■扉絵に挑戦!

ブログ用の扉絵から難しそうなプロンプトを試しました。



→ 結果は、イメージ通り&細かい描写!
 日本語以外は完璧!

この辺りはNanoBananaの得意分野だと思います。

■写真合成もやってみた


りんごの写真を用意して「りんごを増やして」とお願い。

すると、かなり自然な仕上がりに。



さらに「シャンパングラスのシードルを追加」と指示すると、最初はりんご写真が無視されてしまいましたが…「写真に重ねて」と指定したら見事成功。



プロンプトは、しっかり書かないとダメみたいですね。合成の自然さは、ChatGPTより一枚上手かも?

■まとめ

今回NanoBananaを触ってみて分かったことは──

  利点


・イラストが得意
・背景までしっかり描ける
・写真合成が自然

  欠点


・日本語はまだ苦手(AI全体の課題)
・プロンプトは丁寧に書かないと狙いから外れる


イラストや扉絵をしっかり描き込みたいとき、NanoBananaは強力な選択肢になりそうです。

これからはChatGPTと使い分けつつ、アイデア勝負で楽しんでいきたいと思います!