久し振りの「Stable Diffusion」 | 世羅の気功と日常ブログ

世羅の気功と日常ブログ

「何もないと思っていた自分に、
小さな“できた”がくれた喜び」を
テーマに、気ままに想いのままに
書き綴るブログです。

こちらは以前に書いた「Stable Diffusion」のインストールと生成の苦労話の記事です。
 

Stable DiffusionとAI画像生成
https://ameblo.jp/sera-hapihapi/entry-12870745630.html
 

以前、画像生成AIの「Stable Diffusion Web UI」をノートパソコンにインストールした時の苦労話の記事を書いたことがありますが、その「Stable Diffusion」を最近また使用し始めました。
 

というのも、昨年、Adobe Stock(一般の人が写真やイラストを素材として販売するサイト)に着物系のAIイラストを投稿していたのですが、今年も年賀状のシーズンが近づいてきたため、需要のありそうなこの時期に合わせて、再びAdobe Stockへの投稿を始めようと思ったからです。
 

昨年は11月からぼちぼち着物系のAIイラストを投稿していたのですが、審査落ちが多く、修正に時間がかかってしまい、結局お正月までに間に合わなかった画像がたくさんありました。
 

Adobe Stockで画像を販売するには審査を通過しないといけないのですが、写真よりイラスト系は審査が甘いと聞いていたものの、実際には何度修正して再審査に出してもなかなか通らず苦労しました。
 

さらに、AI生成画像の投稿が増えた影響で、審査待ちの時間が昨年は2週間近くかかることも多く、そのせいで年賀状シーズンに間に合わなかった画像が多くありました。
 

その結果、手描きレベルで修正した画像の多くがお蔵入りになってしまったため、今年はその画像を再び修正して投稿することにしました。
 

昨年は着物画像を作る際に、まず参考画像探しから始め、その画像を「Stable Diffusion」の「ControlNet」を使いながら「こんな着物と構図にしたい」というプロンプトを組み合わせて生成していましたが、これだけではAIが学習している「着物もどき」にしかならなかったため、「img to img」という機能も使っていました
 

ControlNet」はStable Diffusionの拡張機能で、手描きのスケッチやポーズ画像、写真などをもとに、生成画像を細かくコントロールできるものです。

ポーズや構図、色合いなどを指定することで、自分のイメージに近い画像を作成できるのですが、細部にこだわると手間がかかります。
 

一方、「img to img」は元になる画像をもとに、新しいスタイルや要素を加えた画像を生成できる機能でこの機能を使うことで、参考画像(フォトリアル)を元に、イラスト用の生成モデルを使うことでイラストにすることができます。
 

そのため、プロンプトだけでは生成できない着物画像を、img to img」を使って生成していましたが、この作業も一筋縄ではいかず、かなり生成に苦労しました

元画像からの変化量を「Denoising strength」という数値で調整する必要があるのですが、数値を低くしすぎると元画像に近くなりすぎますし、高くすると全く別物の画像になってしまうからです
 

私が目指しているのは「ちゃんとした着物画像」ですので、この調整が一番重要になるのですが、数値を0.35くらいから始めて少しずつ調整し、許容できる範囲を見極めながら何度も生成を繰り返す必要があり、これに非常に時間がかかるのです
 

しかも生成できたとしてもそのまま使える画像というのは皆無ですので、指の形をPhotoshopで修正したり、画像に不自然なところがあれば、それを全部Photoshopを使って手描きレベルで修正しないといけませんので、生成だけでも時間がかかるのに、修正をするとなると何日もかかることになります。
 

そもそも生成AIは指などの細部や全身像の描写が苦手で、学習しているデータの範囲でしか再現できません。

そのため、全身画像を生成すると顔が崩れたりして、そのままでは使い物にならないケースも多いのです。
 

写真をもとにイラストを作る際にも、数値を低くするとリアルすぎる顔になり、数値を上げると着物部分が別物になるという問題がありました。

そもそも画像生成AIの多くが着物を間違った認識で学習していますので、ちょっとしたさじ加減でおかしな着物になってしまうのです。

そのため、生成した画像から使える部分を切り取って他の画像に合成して使ったり、顔だけ生成して全身の構図で生成した画像に顔部分を合成したりといった工夫も必要になってきます。
 

こうした作業は気の遠くなるような繰り返しですが、まともな着物イラストを作ることに意義を感じていますので、AIで生成しているとはいえ、ほぼ手描きレベルの加筆修正を行っています。
 

毎日パソコンにへばりつき、肩コリや首コリと戦いながら作業をしていますが、こうして完成させた着物イラストを見ると、達成感があり、苦労が報われた気持ちになります。
 

なぜここまで着物画像の生成にこだわるのかについても書きたいのですが、話が長くなりますので、これについてはまた別の機会にお話ししようと思います。

最後までお読みいただきありがとうございました。