LAION-5Bからのオプトアウトについて誤解があるようですので説明しておきます。
2022年、ジョーダン・マイヤーとマシュー・ドライハーストがスタートアップ企業Spawning AIを共同設立しました。LAIONとは別の独立した企業です。
倫理的な生成AIモデルの構築、クリエイターが自分の作品をどこでどう使われるかコントロールできるようにすることを目標としています。
2022年、人気の画像生成AIモデルStable Diffusionを開発したStabilityAIと提携し、リリース予定のStable Diffusion v3のトレーニングデータセットLAION-5Bをオプトアウト(学習から除外)できるウェブサイトHaveIBeenTrained?を作成しました。
2024年2月、オプトアウト要請を受け入れたStable Diffusion v3とStable Cascadeがリリースされました。
Stable Cascade, #SD3 etc have been carefully checked on the datasets to remove all opted out images from @spawning_ & those that contacted us.
— Emad (@EMostaque) February 22, 2024
We will be discussing this more in future.. https://t.co/nASgfJ01KC
これ以前のモデル、SDXLやSD1、2系はオプトアウトを反映していません。オプトアウトはトレーニング済みのモデルには適用できません。ここは誤解しないでください。
今使われている人気モデルの多くはオプトアウトと無関係ですしLAIONが行ったCSAM(児童性虐待素材)の削除前に作成されているため、著作権や人権問題のあるデータを使用している可能性があります。Stable Diffusion v3より前のモデルは問題が解決していませんし、またローカル環境で使用されているモデルも第三者がコントロールできず、ポルノ製作等に悪用されています。
またStability AI以外の企業の製品はSpawningを介したオプトアウトができませんし、そもそもオプトアウトには法的強制力がありません。
(Hugging FaceでホストされているデータセットにもSpawningのAPIを任意で利用できるようにはなっています。)
しかしStable Diffusion v3の製作までに権利者から寄せられたオプトアウト要請は15億を超えています。現在も要請を受け付けており増え続けています。LAION-5Bのデータ数が約55億ですから、少ないとは言えない数です。
世界中の多くの人の意思が示されています。
Stable Diffusion 3 is announced
— Holly Herndon (@hollyherndon) February 23, 2024
Stability used @spawning_ Do Not Train registry, which has over 1.5B opt-out requests, to filter their datasets before training
Many more models will be released this year honoring opt-outs. I hope we are getting closer to it being standard! https://t.co/NRrnHJPgE0
これも誤解されがちですが、オプトアウトすればトレーニングに使われないだけで、LAION-5Bから削除されるわけではなく、インデックスされたままです。CSAM等人権問題のあるデータを削除して今年再公開されたRe-LAION-5Bには55億超のデータがあると公表されています。Spawningを介したオプトアウト済みのデータも含んだ数字です。
どうしても使われたくない画像は削除すれば、どこの企業も使えません。しかし画像は必要だという場合は、2000年代に戻ったつもりで100KB台、72dpi、長辺500px以下(255以下が安全)の小さな画像に、サインとウォーターマーク(英語がベター)を入れて保護ツールも使えば嫌われます。企業の広告も保護ツールを使ってほしいと思います。
現実にディープフェイクや剥ぎコラ、詐欺広告、なりすまし、LoRAを作る嫌がらせなどの悪用が横行しています。保護ツールを使うしかありません。悪用こそ業務妨害です。
最後に、トレーニング済みのモデルからのオプトアウトが可能になるかもしれない研究が進められていることもお伝えします。
Researchers at @Northeastern Bau Lab (@davidbau) have found a promising method for removing concepts from AI models.
— Spawning (@spawning_) September 19, 2023
This is exciting research that may enable artists to opt out of already trained models!
We are partnering to help collect a list of artists to remove in a study