作ったハイパーネットワークの使い方。
以前の記事で作ったハイパーネットワークですが、500ステップごとのハイパーネットワークファイルは、textual_inversion以下hypernetworksに"xxxx-[サンプル数].pt"といった形で保存されています。これを”stable-diffusion-webui-master\models\hypernetworks”にコピーします。
設定画面よりstable Diffsion→Hypernetwaork、青色のリフレッシュボタンを押して、先ほどコピーしたハイパーネットワークファイルを選択します。これで適度なトレーニングステップ数のハイパーネットワークが使える様になります。
こちらに、ハイパーネットワーク生成時に自動作成される、500ステップごとのサンプル画像があります。それから10500~12000くらいが適当なステップ数と判断しました。
はたして10500~12000ステップが最適なのか、実際にtxt2imgでハイパーネットワークを使い、バッチ処理で64枚画像生成して、生成された画像を評価していきたいと思います。
生成ワードはトレーニング元画像のファイル名”sofia-ashguine”のみで20サンプルです。
10500ステップ
64枚中、5枚が合格画像で12枚が無関係な風景画像。
11000ステップ
64枚中、かなり判断基準を下げて4枚が合格、5個の無関係な画像。トレーニング元の顔から違った顔になっていく傾向。
11500ステップ
64枚中、2枚合格で3枚の風景画像。全体的に老けた顔が多い。
12000ステップ
64枚中、7枚合格で3枚の風景画像。すべてのステップより、安定した画像が生成されたが、顔は老けた印象。
番外編19000ステップ
昭和の雑誌レベルの画質、なつかしい。完全なオーバートレーニング。肌の質感も飛んで、切り抜き感が凄い。
合わせる生成モデルで生成画像も変化。
wd1-2_sd1-4_merged.ckpt[2037c5111]と合わせて使うと、生成画像の年齢が若くなる(子供になります)。猫より子猫がメッチャ可愛い理論、天使のような可愛さです。