先日アップした「Geminiなんとか」記事に少しだけ出てきた「Gemini Live」についてご紹介します。

その記事では、
 ・Gemini Live:
  Geminiによるリアルタイムの音声対話機能で、スマホやタブレットで利用できます。
  人と話すようにリアルタイムで双方向の会話ができ、会話の途中でユーザーが AIの応答を遮って質問をすることも可能です。
‥‥とだけ簡単に記載しました。

この Gemini Liveは、スマホ・タブレットで無料で利用できる機能です。

Gemini Liveは、Googleが開発した AIアシスタント「Gemini」の機能の一つで、まるで人間と会話するように、音声でリアルタイムにやり取りできる機能です。
音声だけでなく、カメラや画面を共有して、視覚的な情報も活用しながら、AIと対話できます。

Gemini Liveの主な特徴とできることは以下の通りです:

  • 自然な会話:
    音声で話しかけるだけで、Geminiが自然な言葉で応答する
  • リアルタイム性:
    会話の途中で割り込んだり、会話を中断して後で再開したりできる
  • マルチモーダル入力:
    音声だけでなく、画像や動画など、さまざまな入力形式に対応している
  • カメラと画面共有:
    カメラで撮影した画像や、画面の内容について質問したり、アドバイスを求めたりできる
  • 多言語対応:
    日本語を含む複数の言語に対応している
  • Googleサービスとの連携:
    Gmailや YouTubeなど、他の Googleサービスと連携して情報を取得したり、要約したりできる


Gemini Liveは、まるで友達と会話するように、気軽に相談したり、アイデアを出し合ったり、学習したり、さまざまな用途で活用できます。

Geminiのヘルプページ「Gemini Live で自然に会話する」が提供されていますので、詳しくはそちらもご参照ください。

以下、iPhone版 Geminiの画面でご紹介します。
Geminiアプリを起動し、画面下部のプロンプト入力ボックスにある「Live」アイコンをタップします。(下図)

 

「Live」アイコンをタップする代わりに、画面を左にスワイプしてもよろしいです。
初回利用時には、利用ガイダンスが出ます
これで Live画面が開きました。(下図)

 

この状態で、すでに Liveはあなたが話しかけるのを待っている状態です。
このまま、Liveに向かって話しかけてください。
質問やネット検索に限らず、日常的な会話・世間話などでもよろしいです。

また、Liveが話している最中でも、割り込んだり、会話を中断してこちらの用件を伝えることも出来ます。
この Liveの応答をさえぎって会話を続けられることが、特徴の 1つですが、これが機能しないときは、Liveから Gemini画面に戻り、プロフィールアイコンから [設定]を開き、「Gemini Liveの応答を中断する」のスイッチをオンにします。(下図)

 

ついでながら、Gemini Liveの応答音声も、この設定画面で変更できます。
上図の「Geminiの音声」をタップし、男声・女声や声質の違いで数種類の音声から 1つ選び「選択」をタップします。

一連の会話が終わり、Liveを終了すると Gemini画面に戻ります。
右上にある「履歴」アイコンをタップしてその会話を選択すれば、その会話がを読み返すことができます。(下図)

 

また、その会話について「Live」ボタンを押して、会話を続行することも出来ます。

コツとしては、まるで友達と話すように気軽に話しかけてみることです。

さて、Live画面の左下にあるカメラアイコンをタップすると、カメラを Liveと共有することができます。
カメラは前面/背面カメラに切り替えることができます。
対象物をカメラフレーム内に収め、「このパズル、解ける?」などと訊いてみました。(下図)

 

一度に空欄を埋めてくれるわけではありませんが、「左上のマスは?」と訊けば「2です」と教えてくれます。

他にも機能はありますが、興味があれば上記ヘルプページなどをご参照ください。