既存のシステムにAIを入力補助的に組こめないか!との問い合わせが最近くるようになりました。
ChatGTP4の有償版だとライセンス的に業務用のアプリにも組こみ可能のようですが、自分にはAIに何をさせ対かがイメージできないので、ユーザを質問ぜめにしてしまいます。
結果、お話はよそに行きます。
まあ、AIのことを私が良く知らないことも大きいのですが・・・。
情報セキュリティー的にも外部サーバに情報を送るわけですから、情報管理の弱点・脆弱性となるわけで、後々何かあるとの思いから後ろ向きになりますよね。
ということでGoogleのGeminiとMicrosoftのCoPilotを恐る恐るいじり始めました。
CopilotはDesigner機能でイメージ画を作成でき、そこそこのレベルであることが分かりました。
ただ、画像を生成するのにDesignerは「ブースト」を使って作画処理を早めているのですが、「ブースト」は一日15回までしか使えません。
「ブースト」の残り回数が少なくなると「CoPilot Pro」にアップするように促されます。
無視して続けると1回の作成に5分前後かかるようになるそうです。
Designerの画面からリワード ポイントを開いて「引き換え」をClickすると開かれた画面の中から「ブースト」をリワードポイントを使って購入できるとのことでしたが、引き換え」の中に見当たりませんでした。
Geminiは「ジェミナイ」と発音するそうです。
ブラウザの読み上げ機能を使うと「ジェミニ」と発音しているので、日本語的には「ジェミニ」で良いのかな?
質問に対する回答は、こちらの方がBardの時から好きです。
整理されていて、分かりやすく、引用の場合、出典が明示されているので安心感があります。
画像生成については、日本語では受け付けてもらえず、英語で指示しないといけないそうです。
また、現状、人物を大きく描くことは出来ないそうです。

Geminiの人物像生成能力の向上に取り組んでいます。この機能はまもなく復活する予定で、リリース更新時にお知らせします。

まだお勉強中ということですね。

言葉で、絵が描けることはすごいことですが、業務上の利用としては文書作成時に、質問してひな形を作るとか、挿入するイメージを作成するとか、統計データを作表するとか位しか思いつきません。
プログラマとしては、言葉で指示をしてコードを書かせるという利用方がありますが、そのコードを利用できるライブラリの指定までしていないことも多く、標準的なライブラリでないものを使用しているコードを返すこともあるので、利用も限定的なものになります。
どちらにしても、現状の業務用アプリの修正程度で組こめるわけではありません。
例えば、注文書などを撮影して、AIに読み込まして、商品・数量・単価・金額を抽出し業務用アプリの項目に反映させるなどの処理は可能かもしれませんが、業務用アプリの設計そのものの変更になり、かなり大規模な改修となります。
まずは、使いなれることかな・・・。

春の嵐山

おまけ
Gemini製のイメージ画像です。
なかなかのものですね、