MIT Tech Review: グーグルが「Astra」発表、AIアシスタントからエージェントへ (technologyreview.jp)

 

「MIT Tech Review: グーグルが「Astra」発表、AIアシスタントからエージェントへ」 (メリッサ・ヘイッキラ [Melissa Heikkilä]米国版 AI担当上級記者technologyreview.jp)がちょっと面白い。

 

「グーグルはAIエージェント「Astra(アストラ)」を発表した。今年後半にリリースされる予定で、AIアシスタントはユーザーの日常生活をサポートするエージェントに進歩する。」

 

「Astraは、競合するオープンAI(OpenAI)が、独自の超高性能AIアシスタント「GPT-4o」を発表した翌日に発表された。グーグル・ディープマインドのAstraは、GPT-4oとほぼ同じ方法で音声や映像の入力に応答する。」

 

「プレス向けのデモでは、ユーザーがスマホのカメラとスマートグラスを物に向け、それが何か説明するようAstraに求めた。デバイスを窓の外に向け、「ここはどこだと思いますか」と尋ねると、AIシステムはロンドンのキングスクロス、つまりグーグル・ディープマインドの本社所在地だと特定した。また、会話の最初に記録された、ユーザーの眼鏡が机の上にあるということも話すことができた。」

 

「テック企業はAIの覇権をめぐる熾烈な競争の真っ只中だ。AIエージェントは、巨大テック企業が開発の最前線を推し進めていることを示す最新の取り組みだ。AIエージェントはまた、オープンAIやグーグル・ディープマインドなど多くのテック企業が目指している、超知能的なAIシステムの仮説的なアイデアである「汎用AI(AGI)の構築」というナラティブ(物語)にも関わっている。」

 

「グーグルが提供するAI検索のもうひとつの新機能は「より良いプランニング」だ。たとえば、旅行代理店にレストランやホテルを提案してもらうように、AI検索に食事や旅行の提案を依頼できるようになる。ジェミニはレシピ通りに調理する際に何をする必要があるか、何を買う必要があるかといった計画をサポートする。また、天気予報のような比較的日常的なタスクから、面接や重要なスピーチの準備といった非常に複雑なタスクまで、AIシステムと対話しながら依頼できるようになる。」

 

「グーグルはオープンAIに対抗する新たな動きとして、新しい動画生成AIシステム「Veo(ベオ)」も発表した。Veoは短い映像を生成でき、「タイムラプス」や 「風景の空撮 」といったプロンプト(指示テキスト)を理解して映画のようなスタイルを制御できる。」

 

Google

 

小松 仁