画像生成AIの中でもAdobe Fireflyは著作権問題のない素材から学習を行っているとのことですが、使用しているAdobe Stockには規約違反の投稿もあり、版権ものも出てきます。
それでもStable Diffusion(派生モデル)のように児童ポルノや盗撮画像が使われたという話は聞きませんので、理解するために試作しています。
これは傘の大きさがおかしい、フードが二重になっている等問題はありますが、狙ったイメージに近く良くできた方です。
一見完成度が高くても手足、指がおかしいことが多く、中でも箸を使う絵を描くのは苦手で成功しません。
日本製のクリーンな画像生成AIは、パブリックドメイン、CC0等権利的にクリーンな画像を使用したMitsua Diffusion が公開されています。さらに学習参加申請が承認されたTwitterアカウントから収集された画像、Discordサーバーに投稿された画像を学習データセットに追加し、合わせて追加学習することで日々進化しています。
公式サイトです。
倫理的問題の解決に重点を置いているため、現時点では表現能力は高くありません。
Stable Diffusionの高い表現能力は権利者の意思を無視して獲得されたものです。それを乗り越える試みとして注目しています。
日本はこういう試みを推してほしいと思います。
PVです。
追記
CLIP text encoder経由でLAIONに依存しており完全にクリーンとは言えません。
また、Mitsua Diffusion OneがOpenCLIPを使用していることについてもご指摘をいただいていますが、その部分も今後改善を検討できればと思っています。一部、使用を隠していたのではないかというコメントもありますが、それは事実ではなくリリース当初からモデルカードで情報を公開しています。(2/3
— Yuya Hanai (@hanasaan_) July 30, 2023