世界から15億を超えるオプトアウト要請 | 牧村しのぶのブログ

牧村しのぶのブログ

漫画家牧村しのぶのブログです。
新刊、配信情報、創作関連の記事を投稿しています。

LAION-5Bからのオプトアウトについて誤解があるようですので説明しておきます。

 

2022年、ジョーダン・マイヤーとマシュー・ドライハーストがスタートアップ企業Spawning AI共同設立しました。LAIONとは別の独立した企業です。

 

倫理的な生成AIモデルの構築、クリエイターが自分の作品をどこでどう使われるかコントロールできるようにすることを目標としています。

 

2022年、人気の画像生成AIモデルStable Diffusionを開発したStabilityAIと提携し、リリース予定のStable Diffusion v3のトレーニングデータセットLAION-5Bをオプトアウト(学習から除外)できるウェブサイトHaveIBeenTrained?を作成しました。

 

2024年2月、オプトアウト要請を受け入れたStable Diffusion v3とStable Cascadeがリリースされました。

 

これ以前のモデル、SDXLやSD1、2系はオプトアウトを反映していません。オプトアウトはトレーニング済みのモデルには適用できません。ここは誤解しないでください。

 

今使われている人気モデルの多くはオプトアウトと無関係ですしLAIONが行ったCSAM(児童性虐待素材)の削除に作成されているため、著作権や人権問題のあるデータを使用している可能性があります。Stable Diffusion v3より前のモデルは問題が解決していませんし、またローカル環境で使用されているモデルも第三者がコントロールできず、ポルノ製作等に悪用されています。

 

またStability AI以外の企業の製品はSpawningを介したオプトアウトができませんし、そもそもオプトアウトには法的強制力がありません。

(Hugging FaceでホストされているデータセットにもSpawningのAPIを任意で利用できるようにはなっています。)

 

しかしStable Diffusion v3の製作までに権利者から寄せられたオプトアウト要請は15億を超えています。現在も要請を受け付けており増え続けています。LAION-5Bのデータ数が約55億ですから、少ないとは言えない数です。

世界中の多くの人の意思が示されています。

 

これも誤解されがちですが、オプトアウトすればトレーニングに使われないだけで、LAION-5Bから削除されるわけではなく、インデックスされたままです。CSAM等人権問題のあるデータを削除して今年再公開されたRe-LAION-5Bには55億超のデータがあると公表されています。Spawningを介したオプトアウト済みのデータも含んだ数字です。

 

どうしても使われたくない画像は削除すれば、どこの企業も使えません。しかし画像は必要だという場合は、2000年代に戻ったつもりで100KB台、72dpi、長辺500px以下(255以下が安全)の小さな画像に、サインとウォーターマーク(英語がベター)を入れて保護ツールも使えば嫌われます。企業の広告も保護ツールを使ってほしいと思います。

 

現実にディープフェイクや剥ぎコラ、詐欺広告、なりすまし、LoRAを作る嫌がらせなどの悪用が横行しています。保護ツールを使うしかありません。悪用こそ業務妨害です。

 

最後に、トレーニング済みのモデルからのオプトアウトが可能になるかもしれない研究が進められていることもお伝えします。