Diffusion・ハイパーネットワークを使う  | ashguineのブログ

ashguineのブログ

ブログの説明を入力します。

 

作ったハイパーネットワークの使い方。

 

 

以前の記事で作ったハイパーネットワークですが、500ステップごとのハイパーネットワークファイルは、textual_inversion以下hypernetworksに"xxxx-[サンプル数].pt"といった形で保存されています。これを”stable-diffusion-webui-master\models\hypernetworks”にコピーします。

設定画面よりstable Diffsion→Hypernetwaork、青色のリフレッシュボタンを押して、先ほどコピーしたハイパーネットワークファイルを選択します。これで適度なトレーニングステップ数のハイパーネットワークが使える様になります。

 

こちらに、ハイパーネットワーク生成時に自動作成される、500ステップごとのサンプル画像があります。それから10500~12000くらいが適当なステップ数と判断しました。

はたして10500~12000ステップが最適なのか、実際にtxt2imgでハイパーネットワークを使い、バッチ処理で64枚画像生成して、生成された画像を評価していきたいと思います。

生成ワードはトレーニング元画像のファイル名”sofia-ashguine”のみで20サンプルです。

 

10500ステップ

64枚中、5枚が合格画像で12枚が無関係な風景画像。

 

11000ステップ

64枚中、かなり判断基準を下げて4枚が合格、5個の無関係な画像。トレーニング元の顔から違った顔になっていく傾向。

 

11500ステップ

64枚中、2枚合格で3枚の風景画像。全体的に老けた顔が多い。

 

12000ステップ

64枚中、7枚合格で3枚の風景画像。すべてのステップより、安定した画像が生成されたが、顔は老けた印象。

 

番外編19000ステップ

昭和の雑誌レベルの画質、なつかしい。完全なオーバートレーニング。肌の質感も飛んで、切り抜き感が凄い。

 

合わせる生成モデルで生成画像も変化。

wd1-2_sd1-4_merged.ckpt[2037c5111]と合わせて使うと、生成画像の年齢が若くなる(子供になります)。猫より子猫がメッチャ可愛い理論、天使のような可愛さです。