ネットで騒いでも意味がないと揶揄されますが、データセットLAION-5Bに児童ポルノが入っていると注意喚起する人が増えた結果、検索しても無修正や児童ポルノは削除されて減っているのがわかります。
検索はこちらからできます。
データセットからポルノが消えれば生成できなくなります。
すでに拡散されているデータは取り返せませんが、せめて新製品ではポルノを作りにくくなるようにしたいと思います。
日本人の名前は日本語と英語と両方で検索すると出てくるデータが違いますので注意が必要です。
一例として「篠山紀信」と「kishin shinoyama」で表示されるページを比較してみます。
上が日本語、下が英語です。全く違います。
以前はヌードが大量に出て、別人の撮影したポルノや児童ポルノも見つかりましたが、現在は出なくなっています。
ネットで広く訴えていかないと権利者が知らないままで終わってしまい改善しないため、繰り返し投稿しています。
少女ヌードで知られる写真家清岡純子は、日本語検索では偽物も含めたヌードはほぼ出なくなっていますが、英語検索ではまだ出ます。写真の評価とは別に、データセットに入れられると悪質な児童ポルノを生成する道具にされてしまう問題があります。
過去ヌードを撮影したことのある人は、自撮りの著作者としても被写体としてもオプトアウトできますから、考えて下さい。
データセットがクリーンになれば悪質なポルノは作れません。
今できることはそれだけです。
どうぞよろしくお願いいたします。
LAION-5Bは有志により画像が見える形で中身が公開されたためオプトアウトが可能になりましたが、個人の追加学習についてはブラックボックスです。
現にAI生成ポルノが大量にばらまかれています。
放置すれば警察のリソースも足りなくなります。
規制しない方針には賛成できません。

