GPT-4o 凄い! | 七転び八起きの爺さん

七転び八起きの爺さん

いろいろな事業の失敗と成功を繰り返した事業経験を持つ爺さんです。

オープンAIは、人間と同等の反応速度で映像を認識するAI技術「GPT-4o」を発表。遅延を解消し、人の感情まで理解。ロボットや車との融合が進み、利便性が向上。生成AIの使い勝手がよくなることで、機械の操作性がさらに高まる。オープンAIは自社のAIモデルの普及に力を入れ、処理スピードを2倍に高速化し、運用コストを半減。無料による普及を優先し、AIサービスで主導権を握る。

GPT-4oはOpenAIが開発した最新のAIモデルで、音声、画像、テキストを統合的に処理するマルチモーダルAIです。音声合成とは、人間の声を模倣する技術のことを指します。GPT-4oの音声合成機能は、人間と同じ反応速度で話すことが可能で、音声入力に対しては最短232ミリ秒、平均320ミリ秒で応答可能です。これは人間が会話で反応する時間と同じとされています。また、GPT-4oは感情を込めた表現も可能で、例えば、デモでは「あなたの良い気分の理由を共有したいですか?」といった感情に寄り添う応答が示されました。これらの機能により、GPT-4oはより自然で感情豊かな音声アシスタントを提供します

 

#AI #オープンAI #GPT4o #生成AI #ロボット融合



【日経から】#チャットGPT 新基盤、遅延なく会話 生成AI、ロボ・車と融合 https://www.nikkei.com/article/DGKKZO80670950U4A510C2EA1000/