MIT Tech Review: AI訓練データに個人情報、身分証や履歴書など数百万件

 

「MIT Tech Review: AI訓練データに個人情報、身分証や履歴書など数百万件」がちょっと面白い。

 

「アイリーン・グオ[ Eileen Guo ]

米国版 特集・調査担当上級記者

特集・調査担当の上級記者として、テクノロジー産業がどのように私たちの世界を形作っているのか、その過程でしばしば既存の不公正や不平等を定着させているのかをテーマに取材している。以前は、フリーランスの記者およびオーディオ・プロデューサーとして、ニューヨーク・タイムズ紙、ワシントン・ポスト紙、ナショナル・ジオグラフィック誌、ワイアードなどで活動していた。」

 

「生成AIモデルの訓練に使用される最大規模のオープンソースデータセットの1つに、個人を特定可能な機密情報が多数発見された。Webスクレイピングによって収集されたこれらのデータは、AIモデルに取り込まれて、プライバシーの侵害につながる恐れがある。

この記事の3つのポイント

・大規模AI訓練データセットに数百万件の個人情報が混入していることが研究で判明

・既存のプライバシー保護対策が機能せず、根本的な技術的課題が浮き彫りになった

・現行のプライバシー法では対応が困難で、AI開発における同意の概念の見直しが必要」

 

Stephanie Arnett/MIT Technology Review | Adobe Stock, Envato

 

小松 仁