生成AIを壊す新技術「Nightshade」

・生成AIにアーティストが反撃、汚染データでモデルを壊す新技術

AIによる画像の無断利用にアーティストたちが対抗する新たなツール「Nightshade (ナイトシェード）」が開発されました。

アーティストはNightshadeを用いることで、自らの作品中のピクセルに対して、人間の目には見えないものの、生成型AIモデルが「無秩序」かつ「予測不能」なかたちで破綻するような変更を加えられるようになるという。

・Nightshade (ナイトシェード）

大規模AIモデルのデータセットは数十億もの画像で構成される場合があるため、より多くの汚染画像がモデルの訓練用に収集されるほど、同手法が引き起こすであろうダメージはより大きくなる。

・Nightshade レポート　

開発者チーム：シカゴ大学のベン・ジャオ教授

ナイトシェードは、生成AIモデルのセキュリティ脆弱性を利用している。

つまり、生成AIモデルが膨大なデータ（この場合はインターネットから取得された画像）に基づいて訓練されるという事実を使っている。ナイトシェードは、訓練用画像を使い物にならなくする機能を持つ。

例えば、犬のことを実際には猫だと学習させ、その結果としてテキストプロンプトとは一致しない誤った画像をモデルに生成させることができるようになる。

今回の研究論文によると、Nightshadeの毒サンプルは100サンプル未満で「Stable Diffusion」を破綻させることができたという。

・関連記事　

「Nightshade」登場！AI学習を阻害する新技術と著作権保護の新しい道

らい氏のブックマーク