20250414追記
ReForgeの開発が終了したとの知らせが届いた。
AUTOMAITC1111は今まで通り使うとして、フォーク版の何か面白い物でも探しに行くか。
(Comfyから目をそらしながら)
以下2025年3月時点の記事になります。
試しにEasyReforgeという、stable diffusionのフォーク版(を簡単に触れるようにしたもの)というものを入れてみた。
Stable diffusionよりも画像生成が速くなるという触れ込みだったので半信半疑で、
作者様のページからexeファイルをダウンロードし、サイトに書いてある手順通りにして導入した。
正直自分の文章などを読むより作者様のページを直読みした方が早い。
やり方はちゃんと日本語で書いてあるので説明に従って導入。(gitとpythonは導入してある前提で)
こんなんで本当に早くなるのか。
速いわ(個人の感想です)画像生成から拡大処理まで早いわ(あくまで個人の感想です)
ナチュラルなセッティングでまあ速い。
4070ti superでも3060でも十分速い。noobai系などは最適ではないだろうか(個人の感想です)
さらに自分が入れたプロンプトから連想して単語を増やしたりしてくれるTIPOが最初から実装されていたりと、
元であるForgeは色々あって簡単に導入できるものではなくなってしまったので、今から始めるのであれば簡単に素早く出来た方がいい。
前からずっと生成している自分のような人間にはずっと使ってきたシステム(ごく普通のAUTOMATIC1111)とか、Comfyとか使っていた場合にはフローチャートがなくなるので違和感が生じるとは思うが、
そうでもなければそれなりに保証された速さがあった方がいい。使い勝手というものがあるから強制は出来ないが。
このEasyReforgeではインターフェイスにも日本語が書いてある部分があり(全部ではないが)必要最小限の真っ先に使う部分には日本語がちゃんと書いてあるので、初っぱなから何をしていいか分からないということにはなりにくいだろう。
まあどっちみち英語と顔を合わせたりスマホの画面で翻訳した上で画面に書いてあることを覚えなければいけない。
あとは延々と自分に合うCheckpointとLoraを探しに行く作業が続くわけである。
まだ日本語の生成AIは個人の努力と有志のmodで何とかしなければならない時代である。
日本語の文章の生成AIでもたまに「え?」と思うような日本語を理解していないような文に出くわすときもあって、
英語が本場のプログラムではそこに依存している言語は割を食わざるを得ない。
かと言って中国語も結局は文法的には英語に近い配置になるので、
同じに見える漢字(簡体字)もよく考えたら日本の漢字とは違うし、結局生成AIを使う上で英語は避けられない。
絵を描くためのプロンプトも結局は英語前提なのだから、AIに聞いて翻訳するなり、
こんな絵が欲しいと思う絵を生成AIに読み込ませて英語のタグをつけてもらうなりして自分も学習しないといけない。
何も考えないで頭の中にある構図を単純にポンポン絵を描いてくれるような夢のシステムではございません。
ただプロンプトがどうやっても浮かばん!という人のために最初の方に書いたようなTIPOというのがあるわけでございまして、
最低ここだけは描いてほしいポジティブとネガティブのプロンプトを入れておけば、
あとは生成AIの側である程度自由にポジティブプロンプトの増量、肉付けをしてくれるわけである。
これで生成される画像がワンパターンで構図も常に同じというマンネリからも脱却できる。
いいなあ、と思ったものが出力されたらその絵の肉付けされたプロンプトをコピペすればいい。
ついでにプロンプトで英語について軽く学習することもできるだろう。
細かくやるならきちんとした設定が求められるが、ざっくりでもそれなりに変化がでるので、
生成された画像一枚一枚のプロンプトを参照しつつ自分の理想に近づいて行くことができる。
画像生成AIが出来たての頃のような「この画面をどこから触っていいかわからない!」という環境ではなくなっている。
今は沢山の人が使用環境や生成方法についての説明をしてくれるページがあるので、
自分が画像生成AIを始めた頃の本当に手探り状態、暗中模索で正解を探していく作業とは明らかに異なる、
ここを触れば少しずつでもわかるようになる要素が増えていると感じる。
いずれは日本語のインターフェース、日本語だけでプロンプトを入力し一々英語に直さなくても画像が生成できるようになり、
出した画像のプロンプトにも日本語でびっしりと何が書いてある時代になれと思いながら。
まあ極論danbooruの好きな画像についているタグを丸写しでいいんですけどね。
最近は予測変換でそのタグも楽に出せるようになったりしたりする。
ただ序盤で簡単なスペルミスでもするとたちまち予測してくれなくなりますが。
生成AIを扱うにも、使う人の知識がある程度追いついてなければ理想に手が届くまでにはどうしても時間がかかってしまう。
まだ日本語の知識と画像タグの英語が直結するには手間暇がかかりそうである。
誠に遺憾である。