データセットLAION-5Bを検索できるhaveibeentrained.comがリニューアルオープンしました。CSAM(日本では児童ポルノ)がどの程度削除されたか確認し、完全ではありませんが問題になりそうなイラストや漫画も削除されていることを確認しました。
肝心な自分の絵は以前単語と画像で検索して全部オプトアウト(学習対象から除外)したので残っていないと思っていました。しかし念のため再度検索したところ、以前オプトアウトしたのと同じ画像が2件(10枚以上)見つかりました。一度削除した後にまた入れられたようです。時々確認しないと除外されません。
画像左下のチェックボックスをオンにして、右上のDoNotTrainを推せば消えます。
気になる方はご自身でお確かめください。
以前できた画像検索はできなくなっています。私は自分の商業用ペンネーム、投稿に使った名前、投稿サイト、レーベル、雑誌の名前、単行本タイトル、日本+女性(レディース)+漫画(コミック)さらにサスペンス、不倫、復讐、虐待も加えて検索しました(以前それで出たのもあります)。
日本語と英語、アルファベットで結果が違いますので両方で検索してください。
まだ見落としがあるかもしれません。
どこまで有効なのかは疑問です。
以前DLされた、現在使われている製品からは消えません。