最近将来に対するぼんやりとした不安を抱きComfyUIに手を出し始めた | 隠者の庵

隠者の庵

自閉症スペクトラム(広汎性発達障碍)当事者が気ままに壁打ちで文章を書き連ねます。
あと趣味についても適当に書き連ねます。何故か見た夢も記述します。

画像生成AIを使い始めて一年、ついにStable Diffusionだけでなく、別なUIに手を出し始めた。

深い意味は無い。何となくそうしなければいけないと思うから手を出している。

そしてぼんやりとした心理的状態でComfyUIをPCにぶち込む作業を始めた。

一年間、始めたばかりの頃はNMKD(初期はRadeonをぶん回していた)を使い始めて、その後GeForceに乗り換え、

Stable Diffusionを使って画像を生成する修行を積み重ねたが、一年経ってもよくわからないことだらけである。

特にプログラミングの知識も無いので、PositiveとNegativeのプロンプト以外は全部勘で動かしている。

SD1.5環境からSDXL環境に移行するときも全部勘であった。

そんな奴がComfyUIを導入して画像生成環境を一新する作業に取りかかるのである。後はお察しください、の世界である。

わからないことがあればGoogleで調べて全部何とかするしかない。誰も近くに聞けるだけの知識のある人がいないから全部自分でやるしかない。

そうして三日ぐらい経つが未だにどうして動いているかがわからない。全部勘で動かしていると言っても過言ではない。

勝手にいじると動かなくなるのでうかつにいじれない。どうしてこんな奴が画像生成AIを使おうと思ったんだ。

 

確かにSDXLの素材の力はすごい。Loraがなくても何かちょっと無茶をすれば1.5以上の構図の自由性、

それから表現力、破綻しにくい(しないとは言ってない)ポージング、

どれをとっても1.5の表現力に比べれば段違いである。

だけれども、自分の使っていたSD1.5時代のCheckpointでないとどうしても出せない味がある。

学習データの違いというか、学習の方向性の違いというか、完全に好みの問題なのだが、

要するに1.5で学習データを作っていた人がSDXLで作らなくなったので代替品もないような状況である。

Checkpoint然り、Lora然り。有名なキャラならSDXLのプロンプトで再現できるが、

ドマイナーな、レトロな奴とか、B級な知る人ぞ知るようなキャラとかを出すにはLoraがないといけない。

では新しいLoraがお出しされるまで指をくわえて待っていろとでも言うのだろうか。

というかSDXL環境ではLoraをCheckpointをまたいで使用することは難しくなった。

Animagine系か、Pony系か、その他の系統が新しく生まれてくるか(まるで競馬の血統の何とか系、みたいな話だが)

どのCheckpointでも動くようなLoraを作るのは本当に仕様上難しくなったので、

どのCheckpointの系統で動かすかを決めて、その系統だけで動かせるLoraしか作れないような状況である。

しかしSD1.5のLoraはSDXL環境では本当に認識すらされないので、動きもしない。Embeddingとかも全然使えない。

それを何とかする「X-Adapter」なる技術も最近出始めたがまだ日が浅いために試行錯誤の日々である。

というかこれは現状Stable Diffusionでは使えない。ComfyUIなら使えるかもしれない、というか試作品(?)が出来たが、

プログラミングの知識が全く無いような奴の前ではまさに無用の長物、エラーを吐いて使い物にならない。

誠に遺憾である。

 

というかComfyUIを導入した理由の大半が「SD1.5からSDXLに移行したが1.5の素材を無駄にしたくない」

画材を変えたら急に自分の中では作品の質が変わってしまって、何となく納得いかない、とかそういう理由である。

スポーツで靴やラケットなど使用器具を変えて新しい環境に慣れるのに時間がかかる、とか大体そういうことである。

いずれ古い道具から新しい道具に一新しなければならないが、急に変えるには体と技術がまだついていかない。

急に変えたばかりでは当然動かし方もわからないので他人様のワークフロー(.json)を引っ張ってきて動かしている。

ComfyUIなら二つ以上のCheckpointをワークフロー内で一度に使えるのでブレンドできないか、と考えて、

SDXLでt2iで画像を生成した後、SD1.5でi2iするという半ば強引な手段に出た(そういう.jsonをDLしてきた)

 

 

これならSDXLの表現力に加えてSD1.5の好きな画風に強制的に仕上げることも可能である。

Stable Diffusionだと一枚ごとにいちいちt2iからi2iに送り込んで、いちいち微調整したり修正したりも面倒くさいから、

ワークフローを組んで強引にワンタッチで全部何とかならないか、という理由で、ComfyUIを導入した。

もっとも、何をどの順番で片付ければ(自分の好み的に)ちゃんとした画像が仕上がるのか、

どういう仕組みで動いているのか、ぜんぜんわからん!とつぶやき続けるだけの日々なので、更に好みを追求するために、

ワークフローの線を引いたり引き直したりエラーを吐き出したり試行錯誤する毎日を送っているのである。

じゃあ自分でSDXL用の画像を集めてMergeしたりLora作りゃいいじゃん、といわれるがグラボの性能的に無理なので、

本当に強引に何とかしたのが上記の作戦である。

プログラミングの知識とか授業とか何も受けていないとこのように無様に舞う様を見せつける羽目になります。

テンプレを誰かから拝借して、自力学習してようやく自分の方向性を見いだせるようにしかなりません。

ちゃんと情報機器の教育は受けておきましょう。

というか自分の頃は「情報」とかいう科目がなかったので、何とかしたいがどうにもならない。

なお中学、高校の時に在籍していたのはパソコン部である。誠に遺憾である。