データを全部破棄すれば解決 | 牧村しのぶのブログ

牧村しのぶのブログ

漫画家牧村しのぶのブログです。
新刊、配信情報、創作関連の記事を投稿しています。
Xもご覧ください。https://twitter.com/buncho108

画像生成AIのデータセットには個人がブログにアップした写真、友人の写真、街中で撮影された写真、殺人事件の被害者の写真、生存者の写真、病院で撮影された医療写真他大量の個人情報が含まれます。それらも全て表現力の高い画像を生成するために活用されています。しかも元の画像に酷似した画像を生成できることが実験で確かめられています。過学習によりその確率が上がると報告されています。多くのデータを使う合成のようなものだからプライバシーは問題にならないという俗説は否定されています。

児童ポルノも被害者が生成されるリスクも含め存在し続けます。

AI生成物は創作物と違い確実にデータに被害者がいます。

データに被害者がいる限りそれを生成して個人が主有することができます。売買する必要もありません。規制もできません。

 

無許諾学習をするから違法なデータが入り込みます。

違法な画像も学習すればするほど表現力が上がります。

許諾を得て学習させているモデルは表現力が劣ります。

ミツアモデルが好例です。

FireflyもDall-eと比べると不得意分野があります。

日本の絵を大量に学習させたかどうかの差が出ます。

Stable Diffusion、その派生モデル、リークモデルのように倫理を犠牲にして無許諾学習で作られたモデルに人気があります。

他人を犠牲にしても高品質を求めるエゴを抑えられません。

 

幸いStable Diffusionはデータを使わせないオプトアウト申請もできるようになりました。しかし申請のほとんどは作品を集めたプラットフォームからです。一般人が自分の写真や絵を見つけるのは困難です。データベースも、データを集めたモデルも全てを破棄しなければ解決になりません。

OpenAI、Google、Midjourneyなど他の大手はオプトアウトの選択肢さえ提供していません。


完全なオプトインなら個人情報は守られ、アートも守られ、児童ポルノが紛れ込む恐れもなくなります。