Diffusion・ハイパーネットワークを使う　 | ashguineのブログ

ホームピグアメブロ

芸能人ブログ人気ブログ

ashguineのブログ

ブログの説明を入力します。

Diffusion・ハイパーネットワークを使う　

作ったハイパーネットワークの使い方。

『Diffusion・ハイパーネットワーク再トレーニング』完璧を求めて再トレーニング　過去二回Diffusionのハイパーネットワークのトレーニングを行ってきた。１回目と２回目のトレーニングでも改善するべきところが…

以前の記事で作ったハイパーネットワークですが、500ステップごとのハイパーネットワークファイルは、textual_inversion以下hypernetworksに"xxxx－[サンプル数].pt"といった形で保存されています。これを”stable-diffusion-webui-master\models\hypernetworks”にコピーします。

設定画面よりstable Diffsion→Hypernetwaork、青色のリフレッシュボタンを押して、先ほどコピーしたハイパーネットワークファイルを選択します。これで適度なトレーニングステップ数のハイパーネットワークが使える様になります。

『Diffusion・ハイパーネットワークのトレーニング３回目結果　』寝ている間にAIを鍛える。Diffusionでのトレーニング。RTX4090ならたぶん発火することでしょう、安心して仕事を任せて眠っていられる、GTX107…

こちらに、ハイパーネットワーク生成時に自動作成される、500ステップごとのサンプル画像があります。それから10500～12000くらいが適当なステップ数と判断しました。

はたして10500～12000ステップが最適なのか、実際にtxt2imgでハイパーネットワークを使い、バッチ処理で64枚画像生成して、生成された画像を評価していきたいと思います。

生成ワードはトレーニング元画像のファイル名”sofia-ashguine”のみで20サンプルです。

10500ステップ

64枚中、5枚が合格画像で12枚が無関係な風景画像。

11000ステップ

64枚中、かなり判断基準を下げて4枚が合格、5個の無関係な画像。トレーニング元の顔から違った顔になっていく傾向。

11500ステップ

64枚中、2枚合格で3枚の風景画像。全体的に老けた顔が多い。

12000ステップ

64枚中、7枚合格で3枚の風景画像。すべてのステップより、安定した画像が生成されたが、顔は老けた印象。

番外編19000ステップ

昭和の雑誌レベルの画質、なつかしい。完全なオーバートレーニング。肌の質感も飛んで、切り抜き感が凄い。

合わせる生成モデルで生成画像も変化。

wd1-2_sd1-4_merged.ckpt[2037c5111]と合わせて使うと、生成画像の年齢が若くなる（子供になります）。猫より子猫がメッチャ可愛い理論、天使のような可愛さです。