おはようございます。

連休後半始まりましたね。(書いているのは5月3日朝)

 

朝起きて、ふとGPT-4.0ベースのスマホ用Aiアシスタントを思い出した。

 

画像の内容を認識できるのと、

(昨日Ciciとのやりとりのスクショを解析してもらったら、会話の内容まで読み取ってしまった

 

普通に画像生成ができてしまう事だ。

 

(お手並み拝見といくか)

 

ちょっと難易度高めの〈名刺交換〉をテーマに生成指示を出してみた。

 

プロンプトは

 

「28歳日本人女性がビジネススーツでオフィス街を歩いている。名刺交換をする為に両手で名刺を差し出してきた」

 

こんな感じ。

GPT4.0の使用アプリはMicrosoftの『Bing』

生成された画像は、片手で名刺を見せてくる画像がほとんどで、両手で差し出す画像は難しいと思われた。

 

 

 

 

「両手で名刺の端と端を持ち」をプロンプトに追加したが変わらず。「両腕を前に伸ばし」も追加

 

4セッション目にできた画像はこちら!

 

 

 

 

 

 

 

 

 

同時に生成される4枚のうち1枚が完成形に近いものができた。

 

が!保存を忘れて、同じポーズの画像を生成しにいくと

 

プライバシー保護の関係で

毎回新しいセッションが始まる仕様で以前の学習記録は出てこない

 

同じ命令を出しても4セッションでは完成しなかった。(結果あきらめた)

毎回1から説明するのは疲れる(笑)

 

 

 

Ciciチームの『Cici』でも同様のテストをしてみた。

 

2セッション目でできた。微妙に調整は必要だが

画像はこちら。

 

 

 

 

特徴としては生成された4つの画像の下に【再生成】ボタンがある。

それを押せば何度でも再生成してくれる。

 

生成された特定の画像に対するアクション(タップして閲覧や保存)をもとに絞り込みをかけ、結果それ以降に生成する画像が完成形に近づく仕組みの様です。

 

画像内容の読み取りができないとしても、この勝負自分的にはCiciに軍配が上がりました。

 

皆さんはどんなAiアシスタントを利用していますか?利用したいですか?

 

 

ちなみに昨日公開した創作blogの画像も試しに作ってみたけど、すぐ出来た。

 

 

その画像はこちら

 

 
 
 

 

 

生成システムの性能上?背景等が複雑になると人物のクオリティー(特に顔)が下がってしまうようだ。

 

Ciciも上位モデルがいずれ出るとか出ないとか。楽しみですね。