Googleの生成AIサービス、以前は「Bard」という名称でしたが、現在は「Gemini」に替わっています。
その「Gemini」のモバイルアプリの提供地域が拡大され日本でも利用することが出来るようになりました。

Android版は Google Playストアからダウンロードできます。
iOSでは、専用アプリではなく、検索アプリ「Google」から利用するかたちになります。

以下は、iPhone版「Google」検索アプリでの画面で試してみます。
「Google」アプリを起動し、ホーム画面の最上部に「G 検索」ボタンがあり、その隣に十字の光源のような「Gemini」アイコンがあります。(下図)

 

これをタップして Gemini画面を開きます。
初めて利用するときは、下図の画面が現れ、利用規約の同意を求められます。

 

「同意する」をタップして進みます。
Geminiのプロンプト(質問や指示)入力画面が開きました。(下図)

 

「おはよう」の下にいくつかプロンプトの例が並んでいます。
これらは表示しないようにするなら、左にスライドして最後の「候補を非表示」をタップします。
その下「最近」の下には入力したプロンプトの履歴が表示されています。
「最近」の右端の「>」をタップすると、これまでの履歴が表示されます。
初めて「Gemini」を使う場合も、「Bard」のときに利用した履歴が表示されます。

そして、画面下部にプロンプト入力欄が表示されています。

ここに書かれているように、ソフトキーボードを使ってプロンプトをタイプ入力してもよいし、マイクアイコンをタップして音声で問いかけてもよいし、カメラアイコンをタップし写真を示して質問してもよいです。

試しに、カメラアイコンをタップし写真ライブラリの中の写真を選択し、さらに「この写真はどこの風景でしょうか?」とプロンプトを記入し、右下にあるアイコンをタップしました。(下図)

 

すると、「金町浄水場の取水塔」である旨の回答が表示されました。(下図)

 

上図はその回答の一部で、この下にさらに説明が続きます。
もちろん、これを受けてさらに質問などを続けても構いません。

「Gemini」の最大の特徴は「マルチモーダル」であることが上げられます。
つまり、テキスト、画像、音声など複数の種類のデータを同時に扱えるということです。
上で試したように、写真を提示し、それについてテキストで質問できることも、小規模ながらその一例です。

なお、デスクトップ版のChromeでも Geminiを利用できます。
Chromeブラウザでコチラにアクセスして利用できます。
ここでも、スマホ版と同様に写真や音声などを組み合わせてプロンプトとすることができます。

また、Geminiについての詳細は Googleのサポートページ「生成 AI の詳細」で知ることができます。