Bing Image Creatorー(2)2つの画像生成モデル、動画生成、速度 | virt_flyのブログ

virt_flyのブログ

フライトシミュレーターソフトのFlightGearで仮想飛行を楽しむブログです。

黎明期の飛行機に乗り手を振る女流飛行士

↑Bing Image Creatorの「GPT-4o」モデルで作成した「黎明期の飛行機に乗り手を振る女流飛行士」の実写風画像

 

【目次】

(1)すべきことはシンプル(前回)

 ・移民でなくても、AI・ロボットに仕事を奪われる

 ・Bing Image Creatorでとりあえず絵を作成してみよう

 ・保存・ダウンロード・再作成

(2)2つの画像生成モデル、動画生成、速度(今回)

 ・2つの画像生成モデル

 ・動画作成

 ・生成速度と制限

(3)プロンプト入力の内容が肝心(次回)

 ・プロンプト入力の実例

 ・アダルト的、暴力的な描写は画像の生成・提供を拒否されたり、警告を受ける

(4)画像の編集(次々回)

なかなかの出来栄え!でも微妙なところも

 

前回は、Bing Image Creatorを使ってとにかく画像を作成し、また保存するにはどうすればよいのかにふれました。今回は、2つの画像生成モデルや動画作成について試してみます。

 

 

■2つの画像生成モデル

 

Bing Image Creatorでは、画像の作成にあたり「GPT-4o」と「DALL-E 3」という2つの画像生成モデルが選べます。

 

Bing Image Creatorのモデル選択画面

↑画像1)[モデル:…]をクリックし、画像生成モデル選択用のドロップダウンメニューを開いたところ

 

プロンプト入力枠の下部に、「モデル:…」と書かれた箇所があります。ここをクリックするとドロップダウンメニューがひらき、「GPT-4o」と「DALL-E 3」という2つの画像生成モデルが選べるようになっています(画像1)。

 

GPT-4oで生成された実写風女流飛行士

↑画像2)「GPT-4o」モデルで画像作成した結果

 

黎明期の女流飛行士 実写風画像

↑画像3)「GPT-4o」モデルで画像作成した結果

 

「GPT-4o」は、「DALL-E 3」より画像の作成に時間がかかり、作成される画像も1つです。これに対し、「DALL-E 3」は作成が速く、作成される画像も3~4と多いです。

 

関心は、両者の画像の出来栄えでしょう。プロンプトで「黎明期の女流飛行士 実写風」と入力して比較してみましょう。

 

黎明期の女性飛行士、飛行機と共に

↑画像4)「GPT-4o」モデルで作成した実写風画像

 

黎明期女流飛行士 実写風画像

↑画像5)「DALL-E 3」モデルで作成した実写風画像の一つ

 

「GPT-4o」モデルで作成した実写風画像は、その当時に撮影され古いアルバムから取り出してきた写真のような古色蒼然たる感じがリアルであり、「DALL-E 3」モデルで作成した実写風画像の方は、往年の写真というより現在のモデルを使い最近撮影されたCM映画の1シーンかのような画像となっています。

 

同様にして、次は「アニメ風」に作成した画像を比べてみましょう。

 

レトロアニメ風の飛行士の女性

↑画像6)「GPT-4o」モデルで作成したアニメ風画像

 

GPT-4oで作成した実写風画像

↑画像7)「DALL-E 3」モデルで作成したアニメ風画像の一つ

 

「GPT-4o」モデルで作成したアニメ風画像の方は、いかにも古いアニメの趣きがあり、「DALL-E 3」モデルで作成したアニメ風画像の方は、CGを使った今風のアニメといった感じです。

 

ポートレート的なものばかりでなく、趣を変えて次は風景で比較してみましょう。

 

雨の交差点を傘を差して渡る人々

↑画像8)「GPT-4o」モデルで作成した実写風画像

 

雨の街並み、信号待ちの車と横断歩道

↑画像9)「DALL-E 3」モデルで作成した実写風画像の一つ

 

いずれも実写風を指定して作成したものですが、「GPT-4o」モデルの方は、車道の信号が青で人が横断しているのはまだ良しとしても、一方通行なのに信号機が反対向きについているのはいかにもおかしいのですが、雰囲気はまるでカメラで撮ってきたかのようにリアルです。他方、「DALL-E 3」モデルの方は、実写とは言い難くイラスト感満載です。

 

「GPT-4o」がよいか「DALL-E 3」がよいかは個人の好み問題ですが、両方を試して使い分けるのがよさそうです。

 

 

■動画作成

 

Bing Image Creatorでは、画像だけでなく動画も作成することができます。とはいっても5秒間ですが。

 

Bing Image Creatorのビデオ作成画面

↑画像10)Bing Image Creatorのサイト画面 プロンプト入力枠の上方に[ビデオ]ボタンが見える

 

動画を作成するには、プロンプト入力枠の上にある[ビデオ]ボタンをクリックして青くしておく必要があります。その後プロンプトに入力し、[作成]ボタンをクリックすると動画作成が始まります。

 

残念ながら動画の出来は芳しくありません。例えば、飛行機である「B-29」の画像を作らせれば、立派にB-29と見えるのに、動画だとどういう訳か似ても似つかぬものができてしまいます(画像11、画像12)。

 

B-29動画作成結果

↑画像11)Bing Image Creatorが作った動画のB-29は似ても似つかぬもの

 

B-29爆撃機、飛行中の実写風画像

↑画像12)Bing Image Creatorが作ったB-29の画像 本物⁈

 

実例を示すことまではしませんが、Bing Image Creatorでほかにもいくつか動画をつくってみましたが、いずれもひどいできでした。似ても似つかぬねぶたに笠もかぶらず手をたたいて囃すだけの跳人だったり、機首ばかりか翼端や尾部にプロペラが付きどちらに向けて飛んでいくのかというような飛行機、など。

 

 

■生成速度と制限

 

Bing Image Creatorでは、画像や動画作成に際して高速と標準の二つの速度があります。

 

動画作成では、プロンプト入力枠の下部に[速度]と書かれたボタンがあり、クリックするとドロップダウンメニューが開いて速度が選べるようです。

 

画像作成では速度ボタンはなく、デフォルトは高速モードのようです。

 

高速モードには制限があり、1日15回まで。作成が15回を超えると標準速度となります。標準速度ではかなり時間を喰い、かなりの我慢を強いられます。無料ですからいたしかたありません。

 

 

今回のまとめ

 

無料の画像生成AIも、動画を除けばなかなかの出来栄えですが、使えるかというと、文字がでたらめだったり、信号機の向きが違っていたりと微妙な場合のあることがわかりました。

 

Bing Image Creatorでは、標準速度であれば無料で無制限に画像作成ができるもののかなり遅く、いろいろ試すには最初の15回までの高速が利用できる間でと覚悟が必要です。

 

効率よく画像を作成する方法はないものか、次回はプロンプトの書き方を考えてみたいと思います。