AIの画像生成でタルパを造るとか考えたら末期だと思う | 隠者の庵

隠者の庵

自閉症スペクトラム(広汎性発達障碍)当事者が気ままに壁打ちで文章を書き連ねます。
あと趣味についても適当に書き連ねます。何故か見た夢も記述します。

(この記事はきっとマニアかAIで画像を作らせた人にしかわかりません。そっと読み飛ばしてください)

 

AI(Stable Diffusion)で画像を作り始めてそろそろ一年くらい経った。

グラボは差し替えたしSSDは大量に追加したけれど私は元気です。

というかcheckpointとloraの組み合わせだけで膨大なものがあるからとても一日で試せる量じゃない。

そこから微調整をする拡張機能とか画像生成自体を拡張するものとか、色々入れたら本当にキリがない。

4TB増やしたSSDが押しつぶされそうだ。あと4TB増やしたい。

で、芸術家のごとくここが納得がいかない、などといいながら三桁か四桁程度生成された画像の山を吟味し、

これがいいとかあれはダメだとか訳のわからない独り言を繰り返しながらとりあえずひとまとめにする。

まあ問答無用ではじかれるような関節の曲がり方がおかしい画像とか、手足がエッシャーになっている画像とか、

クトゥルフ神話並みの異形が錬成された画像を拡大せずに弾けるほどに訓練されると、

次はどのcheckpointを混ぜれば理想の画像に近づけるか、などと譫言を呟くようになり、

checkpointの配合機能を拡張し、何処の部分を残して何処の部分を取り替えるとか、

この辺はリアル重視で、この辺は空想的に、と実際触れた人でないと理解できない呪文をつぶやき、

この画風が無ければダメだとか勝手なことを言い出し、適当に差し替えたりしながら、

AIの著作権というのは実に怪しい物なのでこれから話し合いで決められるだろうとは思うが、

とりあえず法律関係の難しい話は無視しながら自分の都合のいい(ここ重要)画風に近づくようにしていく、

checkpointの調合を繰り返しながら。

そして理想のタッチを、画風を、ほぼ確実に作れるようになったと感じたら次は肝心の理想像本体の生成である。

 

タルパを説明するにしても多分くどくなるので、ウィキペディア先生に説明してもらおうと思う。

要は頭の中で作った仮の生命体らしき仮想現実、ガチでやるならチベット仏教を本格的に調べなければならない。

だが、当然そんな余裕はないので概念程度に捉えておけばいいだろうと思う。

で、画像生成AIがどうタルパに繋がるかと言えば、

特定の画像を作る事を通して自分の神棚のような概念を作成できることにある。

画像の生成に際して、こういうキャラを作る、と決め打ちして、画像生成の呪文を組み、ああでもないこうでもないと、

ブツブツ言いながら最善になるように研究を重ね、大体八割程度の(十割は無理です。残念ながら)完成度になったら、

今度はその八割程度の中から自分が取り入れたい要素を山ほど生成された画像の中から選び出し、

要するに理想像を確定させる作業を行い、顔のパーツ、体型、装飾や服装、その他諸々の特徴を捉えた画像を選別し、

それを更に学習させて、失敗をいかに防ぐか、いかなるシチュエーションでも、プロンプトでもある程度の成功率を保つような、

新しい学習を課して、学習ファイルというかloraを完成させ、そこから延々と同じキャラを錬成し、

(そういう意味では多分柔軟性があるよりは過学習気味の方がいいだろうと個人的には思う)

画像生成AIに「こういうシチュエーションでお願いします」というプロンプトを並べ立てて、

あるときは野外に立たせ、あるときは夜景をバックに、同じキャラを作ることを尽くしていれば、

それはその個人にとって半ば現実にあるものと変わりないように見える。あくまでその人には。

パソコンの中には常にその「人」(まあ理想像なら人でなくてもいい)を作り上げる機能と施設が存在し、

あるときは言葉を投げかけ、あるときは勝手に服装・背景・シチュエーションのloraを組み合わせて気分転換をし、

まるでパソコンの中にその「人」がいるような息吹を感じられるようになったら、

タルパの完成というか他の人から見れば何かが限界に達したのだろうと思われても仕方が無いような状況になる。

そしてそれをプリントしたり立体にしたり他の人からは訳のわからないことをして更に現実に確定させていく。

理想は現実になる。

そこまで来ればもう誰もその存在を疑うことはないでしょう。ああ、あの人何か壊れた、と言われるリスクと引き換えに。

(他の人から見れば)誠に遺憾である。