MIT Tech Review: 脱チャットGPTへ、オープンAIが強化するプラットフォーム戦略
「MIT Tech Review: 脱チャットGPTへ、オープンAIが強化するプラットフォーム戦略」がちょっと面白い。
「オープンAIが開発者向けプラットフォームの強化を打ち出している。音声機能やプロンプト生成機能などを通じて、人間に代わって複雑なタスクを実行できる「AIエージェント」の開発を推進するのが狙いだ。」
メリッサ・ヘイッキラ [Melissa Heikkilä]
米国版 AI担当上級記者
「同社はこのところ多忙な数週間を過ごしている。ロンドンで、オープンAIはリアルタイムAPI(Realtime API)プラットフォームのアップデートを発表した。これにより、開発者はアプリに音声機能を組み込むことができるようになる。同社は音声機能に加え、開発者向けにプロンプト(指示テキスト)の生成機能もリリースした。これにより、開発者はアプリや高性能な音声アシスタントをより迅速に作り上げることができる。また、消費者向けには、チャットボットを利用してインターネット検索ができるようになるチャットGPT(ChatGPT)検索を発表した。
「オープンAIの戦略は、エージェント自体を開発することに加え、開発者が同社のソフトウェアを使って独自エージェントを構築できるようにするというものだと、ゴドマン責任者は説明する。音声は、エージェントの外観や使用感がどんなものになるかを左右する、重要な役割を果たすだろう。」
「そこで鍵を握るのが、オープンAIの「推論」機能だ。 今年10月にオープンAIの「o1」モデルに実装された推論機能は、強化学習を利用して、モデルに「思考の連鎖」を利用した情報処理の方法を学習させるものだ。モデルが答えを生成する時間に余裕をもたせることによって、間違いを認識して訂正する、ひとつの問題を複数の小さな問題に切り分ける、問いに答えるために複数の異なるアプローチをとるといったことが可能になると、ゴドマン責任者は述べる。」
「第2の課題は、異なる種類のツールの連携能力であると、ゴドマン責任者は説明する。訓練データだけに頼っていては、AIモデルの能力には限りがある。Webサーフィンをして、最新の情報を参照できなければならないのだ。チャットGPT検索は、オープンAIの新たなツールがこうした機能を実行する強力な方法だ。」
Stephanie Arnett/MIT Technology Review | Getty
小松 仁
