OpenAI、ChatGPTの仕組みを覗き見る“手がかり”を公開

OpenAI、ChatGPTの仕組みを覗き見る“手がかり”を公開 | WIRED.jp

「OpenAI、ChatGPTの仕組みを覗き見る“手がかり”を公開」（WIRED.jp）がちょっと面白い。

「ChatGPTの開発元であるOpenAIは6月上旬、同社の人工知能（AI)の開発手法に関して批判を浴びることとなった。同社の元従業員らが、人類に害を及ぼす可能性のある技術をリスクの高い方法で開発しているとOpenAIを糾弾したからである。

　これを受け、OpenAIは6月6日（現地時間）に新たな研究論文を公開した。同社はモデルの中身を検証しやすくすることで、AIに伴うリスクに真剣に向き合っていることを示そうとしているようだ。この論文で同社の研究者たちは、ChatGPTを動かすAIモデルの中身を覗く方法を説明している。つまり、誤動作を引き起こす可能性のあるものを含め、AIモデルがいくつかの概念をどのように保存しているかを特定する方法を考案したのである。」

「OpenAIの研究者たちは、この技術の改善にはさらなる取り組みが必要であることを認めると同時に、この研究がAIモデルを制御する実践的な方法の解明につながることにも期待していると論文に記している。「いつの日か、AIの解釈可能性を高めてモデルの安全性と堅牢性の仕組みを理解し、その振る舞いのあり方を保証することで、強力なAIモデルが人々の信頼を得られるようになることを望んでいます」と書かれている。」

PHOTOGRAPH: NURPHOTO/GETTY IMAGES

小松　仁