Stable Diffusionに使われているデータセットLAION-5Bに写真が大量に含まれています。
たまたま私が検索途中に見つけたものの一部をご紹介します。
報道写真、写真集
日本最大の写真販売サイトamanaimages
雑誌
企業の公式サイト
ブログ cocolog-nifty.com
盗撮も含まれています。
漫画やアニメ、ゲーム、イラストに限っては、確かに二次創作を共有して楽しむ固有の文化があります。著作権も親告罪のままで黙認される場合が多い(逮捕者も出ている)のは事実です。
しかしこれらの写真については、コミケのようなイベントはなく二次創作を共有する文化もなく、無断で転載、改変されると直ちに問題にされ、著作者の要請があれば削除されます。
AI生成イラストは漫画やイラストだけで生成されるわけではなく写真のデータも使われています。だから美しい風景や建物や動物が簡単なプロンプトだけで生成できるのです。
従来の二次創作は著作者一人の作画により、オリジナルの著作者の黙認で成り立っていましたが、AI生成イラストは違います。
オリジナル作品とは別の多数の著作物に依拠しています。漫画家が良いといったから良い、というわけにいきません。
一部のレベルの低いイラストレーターや漫画家が自分の権利を守るために感情的に反発し、技術開発を妨げているという世論誘導があるように見えますが、それは事実ではありません。
私の見る限り技術開発に反対しているのではなく無断で作られたデータセットを問題にし、オプトインなら良いという人がほとんどです。
またイラストや漫画は画像データの一部にすぎません。
日本の新聞協会、日本雑誌協会、日本写真著作権協会、日本書籍出版協会が異議を申し立てる声明を出しています。
また著作権だけが問題にされているわけではありません。
医療記録の流出、学習への無断利用は発見した当事者が声を上げましたが、開発企業が削除してくれるわけではありません。対応は個人任せになっています。費用がかかる場合もあります。
検索すれば日本人の医療写真も見つかります。
個人の写真の探し方については以前書きました。
気になる方は確認して対応してください。