園児の写真をポルノサイトに転載、データセットにも組み入れ | 牧村しのぶのブログ

牧村しのぶのブログ

漫画家牧村しのぶのブログです。
新刊、配信情報、創作関連の記事を投稿しています。
Xもご覧ください。https://twitter.com/buncho108

毎日新聞社が「子どもを児童ポルノから守る会」の協力を得て2023年7月以降にネット上で画像検索等で調査した結果、保育園、幼稚園、認定こども園等135園のウェブサイトに、水遊び、泥遊び、ボディーペイント、乾布摩擦、内科検診等の園児の体の一部が露出した画像が掲載されていることがわかりました。

それ自体は悪質な画像ではありませんが、12園が掲載した画像が海外のポルノサイトなどに転載され、6園が掲載した画像はAIの学習に使われるデータに組み込まれているということです。

 

私も以前LAION-5Bの中身を検索できるhaveibeentrained.comで検索し、保育所の子供の顔のわかる画像を見つけたことを報告しています。検索ワードを変えればさらに見つかると思いましたが、やはりありました。

 

根本的な悪用対策はネットに掲載しないことです。無断転載は防げません。右クリック保存は防止できてもスクリーンショットは取られてしまいます。写真は施設の庭の風景や建物、顔の隠れた集合写真等をうまく使うしかないと思います。

 

生成AIに使われてポルノに改変されてしまうこともあります。

自分の写真が見つかったら除外(オプトアウト)申請できます。

以下のような画像保護ツールを使うこともできます。

Glaze

emamori(Mist)

RBGWatermark

 

子供の顔写真が使われてAIで合成CSAMを作られる被害は現実に出ています。防止するためにはデータセットの浄化が必要です。

データセットLAION-5BにCSAM(児童性虐待画像)が入っていることは昨年末スタンフォード大学のインターネット観測所が調査し確認しています。これらが生成に影響する可能性もあります。

報告書原文の13ページの結論では、解決策はデータセットを破棄するか浄化すること、適切な安全対策が取られていないStabLe Diffusion1.5をベースとしたモデルは廃止し、できる限り配布を中止すべきだということです。

The most obvious solution is for the bulk of those in possession of LAION‐5B‐derived training sets to delete them or work with intermediaries to clean the material. Models based on Stable Diffusion 1.5 that have not had safety measures applied to them should be deprecated and distribution ceased where feasible.

 

現在LAION-5Bは公開停止とされています。検索した限りでは問題のあるデータの削除が進んでいるようです。ポルノは出てきません。しかし個人の顔のわかる画像は相変わらず多数見つかります。現在の技術では顔が復元される可能性がゼロにはならず、万全の対策はありません。お気をつけください。