Stable Diffusionが使用しているデータセットLAION-5Bに含まれる画像を検索できるウェブアプリ「Have I BeenTrained?」が公開されています。
アクセスすると検索窓が出ますのでアルファベットで名前を入力して検索してください。
使用してみましたが漢字を使う日本人は同姓同名が多く関連性のわからない人物の画像が大量に出てきます。その中に自分の写真があるかどうか根気よく探すしかありません。
私は写真を公開していないため見つかりませんでしたが、芸能人も別人ばかり出て本人の写真がないことがあります。日本人についてはあまり当てにならないようです。同姓同名の多い山田太郎で草刈正雄が出ました(意味不明)。平沢進は少し出ますが平沢の名前でレスリー・チャンや三島由紀夫など無関係な人物が大量に出てきます。
写真集を出しているある芸能人の名前で検索したところ、なぜかその人は出ず、インスタの自撮りらしき別の女性の写真が大量に出ました。よくある名前なので同姓或いは同名かもしれません。
水着、全裸、ハメ撮りに見える写真も出ました。
別の女性の名前で検索すると無修正児童ポルノ(レイプ)が出てしまいました。なぜ出るのかわかりません。
全てポルノ生成に使われるリスクがあります。
利用者がデータの中から何を選ぶか決めるわけではありません。
AIが使えると判断して選べば使われてしまいます。
貞子で検索すると、さすがに貞子が多かったのですが、その中に
別の一般人の写真が何枚か混ざっていました。
アートだけが学習されているわけではありません。
一般人の写真が学習されていることは確認できました。
その人たちには何の権利もありません。
仮に画像生成に使われたとして、どうやって還元するのでしょうか?何の権利団体にも所属していないはずです。
最悪ポルノに使われても何もできません。
本人が知らなければ何をされても問題にできません。
知り合いが気づいて笑いものにしているかもしれません。
そんな使い方をされるために写真を撮ってアップロードしたのでしょうか?
勿論違法アップロードの可能性もあります。
日本の著作権法では学習段階では違法アップロードされたデータの学習も認められていますが、その結果として生成された成果物が人を傷つける危険性については何の対策も示されていません。
著作権という魔法の言葉で、アーティストだけが学習されていると誤解され、利益を還元すれば良いという話に矮小化されていますが、違います。
人権を踏みにじられる一般人は恩恵なく被害を受けるだけです。
そのLAION-5Bを使っているStable Diffusionをベースモデルとして、多くの派生モデルが共有され、個人が無断で追加学習させた画像も使われています。画像生成AIはそれらを素材として加工しているだけです。悪く言えば自動クソコラ製造機です。
一般人も無断でクソコラの素材に使われています。
画像生成AIの歴史ならWikiで有志が作成してくれたこの画像が分かりやすいですね。 pic.twitter.com/6UZ6mZlvGR
— 某 (@ONobushige) June 8, 2023
基本的に、AI は人間のデータに依存しているため、多くの人々にとって非常に有害となる可能性のある多くの人種差別的な固定観念もプログラムされています。 https://t.co/KSc1CIDZhv
— Darren (@TBVNFC) June 10, 2023
その点を踏まえて規制が必要かどうか、どんな規制が必要か考え声を上げていかないと暴走が止まりません。
ネットで規制を求めるアーティストはLoRAモデルを使って学習され、コラ画像を作られて営業妨害、嫌がらせをされています。
被害が酷いので匿名でかろうじて発信している人が大半です。
前にも書いたようにその筋の業者もポルノを販売していますので、個人的にコンタクトを取るのは危険です。
私も読者の少ないブログでそれでも読んで下さる方だけに発信しています。Twitterの投稿も匿名アカウントのRTが多くて申し訳ありません。
少しずつでも情報を共有できれば良いと考えています。