Google BardがGeminiと改称し、AI画像生成機能がサポートされたので遊んでみました。ウェブブラウザとGoogleアカウントがあれば簡単に使えます。

 

下記のノリノリで踊るニャンズはGeminiに生成してもらったものです。

今の所、画像生成の指示は英語で行う必要があるので翻訳ソフトを併用しました。Geminiに「下記の文章を英訳して」等と指示することも出来ますが、回答が少し詳し過ぎます。

 

Geminiはチャット型AIなので「ノリノリで踊る可愛らしい子猫の絵を生成して」等とリクエストした後、「もっと可愛らしく」とか「もっと楽しそうに」などと作成された画像を見ながら追加指示ができるのが便利です。ただ、「右側の子猫を三毛にして」等と要求するとその他の部分も全て書き換わってしまい、なかなか思い通りには行きません。右側の子猫の口の中が少し破綻していますが、部分修正は諦めました。

 

Geminiにこの絵の説明を求めると「2匹の子猫」「楽しそう、愛らしいなどの感情」「楽譜」等は認識しました。乗っているのは木製のテーブル、流れている曲はピアノ曲だと言っています。また、チャット型の影響なのか、その前に行った作業の影響を受けるようなので、話題を変える時にはタブの終了/再起動などで新しいセションで開始した方が良さそうです。

 

画像認識機能があることを確認したので、今度は上記の絵を基に幼児向けのお話を作ってもらいました。生成された最初のお話に幾つか指示を繰り返して出来たのが下記です。

 

『あるところに、仲良しの仔猫のミミとミミィがいました。

二人はいつも一緒に遊んでいました。

ある日、ミミとミミィは庭で遊んでいたとき、ラジオから音楽が聞こえてきました。

ミミとミミィは、音楽に合わせて踊り始めました。

二人は、くるくる回ったり、ぴょんぴょん跳ねたり、とても楽しそうに踊りました。

すると、そこに蝶々が飛んできました。

ミミとミミィは、蝶々を追いかけて、庭を走り回りました。

蝶々は、ミミとミミィの周りをひらひらと舞いました。

ミミとミミィは、蝶々と一緒に踊っているようでした。

二人は、とても楽しい時間を過ごしました。』

 

あまり出来栄えが良くありませんが、今回はお試しなので適当に切り上げます。

絵には無かった子猫の名前、ラジオ、蝶などが追加されて文章が作成されています。

 

今度は上記のお話を基にして再び絵を描いてもらいます(ここは英文に翻訳して指示する必要があります)。幾つか追加指示を行なって何枚か作ってもらった内の1枚が下の絵です。

 

 

最初の絵とはキャラクターも雰囲気も全く違います(手とか足の指はご愛嬌)。

「最初の画像と同じ雰囲気で」と言ったら画像を元にした指示(プロンプトとして画像を与えること)は未サポートなので受け付けられないと断られてしまいました。

 

Geminiと会話して、絵→お話→絵と生成を繰り返せば簡単に絵本が作れると思ったのですが、キャラクターや全体的な雰囲気を保ったまま別な絵を生成する方法が分からないので今回は諦めました。

 

ブログの文章から絵やイラストを生成することも試しましたが、私のブログの場合、面白いものができません。元のブログがつまらないから、これは仕方がありません。他の方のブログを借用して生成したら、それっぽいものは出来ました。カバー画像に適当なものが無くて悩むことがありますが、自分で作る手もありそうです。

 

GeminiのAI画像生成機能、暇潰しにはなりました。