まずはどこから書くか考えなしに、とりあえずここ1ヶ月ほどの事をまとめていこうとおもう。
何も考えないでキーボ叩いてるから、まぁどうなることやら。
このところあったことをなんとなくまとめていきます。
お暇があれば読んでやってください。
昨今よく耳にするAI。
すでに色々な分野で活躍し始めてますが、特にAI画像出力として画期的なstable diffusion。
無限の可能性があるといっても過言ではないのです。
0から生み出すことや、有を変化させるにしてもやり方によってはそりゃ無限大。
そりゃこぞって出力するだろうし、著作がどうだ権利がどうだ言うよね、それだけの代物。
で、結局怪しげなグレーな部分は多々残っているものの個人的には楽しめれば良いわけで。
絵の上手い人が普通に絵を描いて楽しむ。
コレをかけない人が出来るための環境としては最適だし、色々いじっていく間にわかってきたのが「絵が描ける人がツールとして使う」というのもあるわけで。
この辺はそのうち記事にしてみたいが、今日はまずのっけなので私が使い始めた話から。
簡単に画像生成が出来る!
やっかみ半分でそんなの卑怯だ!みたいな話もありそうだけど、簡単というのは何を指して簡単というのか?
AI画像ってなんぞや?から始まって、興味を持ったので調べていく。(ハイ、沼のスタートです)
↓
stable diffusionなんていうものがある(他にもあるがとりあえず)
↓
当方Macユーザーゆえに「どうせまたWinのみなんでしょ?」って思ってる。
↓
スペック的に向きではないものの、やってやれなくはないと判る(この辺はappleが対応して変わってきてるが)
↓
Googleさんもすでに対策として無料アカでgoogle colabでのstable diffusionはダメってなっちゃってる。
↓
しかたないのでローカルにてstable diffusionの環境を構築してみる。
ココでまずふるいにかけられるよね。
GUIで慣れた人にはCUI使った話とかさっぱりだし。(GUIもあるがその話はおいとく)
私もそう得意ではないので、HowToになりそうなブログ記事を渡り歩いて少しづつ構築。
↓
なんとか動かす事に成功、扱い方をしらないので一つづつ試していく。
私が使い始めたのはいわゆるa1111-sd-webuiというWEBブラウザを介しての操作。
なんてことはない、システム的構築さえ終われば後はただのブラウザなのだ。
ココに到達するまでに根を上げる人もいるだろう。
↓
もちろん英語ベースなので日本語パッチをあてるとか、機能拡張系を主に攻略していく。
↓
いくらか環境が整ってきたので、なんとなく思いつきで画像を一つ生成させてみる。
そして生まれたのがコレ。
命令としてプロンプトにいれたのは「Miku Hatsune」これだけ。(ホントその場の思いつきね)
うーん・・・・・ソレっぽい要素あるけども、うん小学生が記憶で書いたミクさんだね。
どうやったらすでに巷に溢れてるほど高品質なものが出来るのだろうか?
そりゃ続けて調べます。
モデルというものがある、それを変えると画風からなにから変わるし、というのが分かってきた。
いくつか用意して出力を試す。
やはりプロンプトはMiku Hatsuneのみ。
格段によくなったし、画風と考えると淡い色使いも悪くない。
しかし・・・・腕3本あるよね?
そんな感じで色々模索します。
なかにはこんなヤバいのも出ます。
つまり何をいいたいかっていうと話は戻って。
早々『簡単』に出せるわけがないのだ。
どんなソフトを扱うにも知識、経験あればあるほど良い。
結局どこまで行っても熟練度は関わってくるので、それなりに勉強しないとダメなわけで。
この辺りのことはゴチャゴチャしてるので割愛しますが、色々紆余曲折ありまして、今はそれなりのものが出力できるわけで。
自分で絵筆持って1から練習するよりは、遥かに早く高画質で出来のいいものが作れるのは間違いないけど、それでもある程度の努力は必要だとおもう。
それからいくらかして・・・
うん、ホントはもう少し下もあるけど切ってますよw
まぁ裸なのは狙ってなくって、勝手にAIがそう描きたかったんでしょう。(nudeとか入れてない、やはり名前だけ)
それっぽいのは来たけど、なんかまだ画質も眠い感じだし、絵柄?も思ってたのとは違うしっていうのもある。
(この辺りはVAEなるものを導入するといいと知る(詳しくはググってくださいな))
ただ「思ったようなものは出てきてないが、指定したものは描いてある」くらいにはなった。
ここを足がかりに色々とネットの海を彷徨い、プロンプトがキモであると言うのも分かってきたが何分にも英語。
まぁそんなの調べていけば〜ってことで、使えそうな単語やらまとめているブログなんかを読みつつ、入力しつつ、出力させつつ・・・・って日が数日。
その間に機能拡張やらの勉強も同時に読んでいくと、代表的なところでLoRaとかcontrolNetだとか出てきてその機能をいくらか使ってみたり。
そのあたりで面白さがさらに爆発LoRaあさりをしつつ、プロンプトの勉強?を進める。
この辺りは「Civitai」で検索してもらって、言及は避けときます。
その頃出したのがコレ
キャラ物のLoRaの場合、クレジットやらがめんどいので、使ってない例として。
ある程度有名なキャラの場合は名前だけでもなんとでもなる物で。
簡単に思った様な画像を出力させるには、色々駆使していかないと出てこないので、やはり「簡単」ではないのだが、呪文(プロンプト)を駆使しつつ、AIを調教(調整)していく感じは攻略心に火がつくわなぁ。
いくら優秀なLoRaがあっても、複数要素を入れるとガビったりするし、その強度調整とかなんとか、実に簡単にはいかない。
ある程度思った様なものが出てきたと思っても、「一部オカシイ部分」というのが散見されるし。
例えば表情は凄くいいものが描けた! でも指も欠けてた・・・・とかね。(直せるけど)
指などの細かい部分は苦手な様でして(これもモデルによってらしいが)私が最近好きで使っているモデルは顔に特化?してるのか指は苦手なままです。
その辺りに強いモデルをマージさせるのも検討してますが、コレこそ沼要素だし・・・・。
そんな感じであくまでも「個人使用」として、キャラクター物のLoRaを使ってみたり、やはり男の子、アダルティなものとかも出力させてみるよね。
AI君はそのあたりのモラル一切なしで、えげつないものも出してきますが、人間そのうち趣味趣向が出てくるのと、やはりモデルの問題なのか、乳首を描画するのが下手な子らしくって。
あとはおにゃのこばかり出してたせいもあって、いざ男が絡むシーンとか指定しても男自体描画されなかったりw
例えば「女の子を後ろから抱きしめる男の子」を思いつき呪文で入力して描かせても、後ろ向きの女の子が出てきて終わる、とか。
ね?簡単じゃないでしょ? トリガーになる単語を入れることでソレを引き出すにも「経験」が必要なわけで。
そのあたりを確実にするためにLoRAやControlNetなんかを駆使するわけですが、うちの環境だと1枚描画させるにも重いのであまりゴチャゴチャとした処理はしたくない。
この辺の話もそのうちにできれば。
周りの方に比べるとかなり遅くてVramの制限がある環境とだけ言っときます。
でも工夫次第で出来なくはない、そんな感じ。
思った物が偶然描かれて、もっと高画質化したい!とか思ってもある程度までしかできません。
デカいサイズで何枚も一度に処理できる環境が欲しくてたまらない・・・・あぁ。
それでも楽しいことは楽しいので、一定の枚数を描かせて思い通りにいく様になれば、また少し呪文を変えてみたりして。
そんなことやってると、無限地獄にハマっていき、時間はどんどん過ぎていく。
本当はある程度使えると分かった段階でブログつくって、日記的につづっていくつもりだったんですが、何分にも落ち着いて文章書く余裕がないw
何かあれば調べ物をし、それを呪文として描いて出して・・・・の繰り返しをしてたりするとね、沼ですよ。
そんなこんなで、ここ最近は話の最初にも出てきた「著作」なるあたりに気を回していまして。
モデルに関しては出どころのわからないものは使わない、クリアなものだけを使う。
もし使ったとしても生成物は隔離して、分けておく。
LoRaは初期に使うことはあっても、それを外して同様のものが出てくる様呪文のみで構成する。
LoRaを使ったものは基本世に出さない。(著作に問題のないものに限ってはOK)
そんな感じで最近はやってます。
そんな中、架空の女性に何かしてもらう(何かポーズをとってもらうとか、何か着てもらうとかね)というのが楽しく、それこそ出力するまで何が出てくるかわからないし、wildcardなんか使った日にゃ、それこそガチャですよ。
寝る前にどんな構図・シチュで、どういったものを幾らかのランダム要素を加えてぶん回して寝る。
起きたら数百枚の画像がちょっとづつ違う感じで描画されてて、それを良いものだけチョイスする、そんな感じで偶に神描画されたものを見つけると思わずガッツポw
そして例えば基本が、「水着の女の子が夕日の海辺で座っている」とします。
そういう呪文を打ったとしても、たまに座ってない。
なんなら青空。
海辺なのに水に浸かっている。
思ってない物が出てくるとちょっと吹いたりしますが、それはそれでよかったりするし。
でもAI君が苦手な物に「左右対称」もあるようで、右と左でデザインが違う水着だったりする。
(デザイン的ではない片方肩紐ないとか)
もちろん中には指6本とか、足折れてるとか、ありますよ?(特に足の指は不得意で7本あったりね)
砂に半身埋まってるとかさ。
(もちろん、ネガティブに色々いれてますが、それでもね?)
最初は直せば直るんだし、表情がよければ取っておくとかしてたが、直すにも手間がかかるので、最近はバッサリ切り捨ててる感じ。(このあたりもVramの問題でクリアできるだろうけどもねぇ・・・・)
問題なさそうなものは残し、その中からよくできましったっていうのをチョイスし、時間が許せば一部高解像度化させてさらに別ソフトでアップスケーリングしてみたり。
この辺りの話もまた今後かなぁ・・・。
次回からはもちょっとナイスな画像も用意しておきます。
(倫理的にマズそうなのは貼らないよっ、モザイク要りそうなのとか!)
いわゆる着エロ的な物でグッとくる物が生まれたらいいなぁというような、そんなところから開始します。
ちょっと停めどもなくなってるので、初回の記事はこの辺にしておこう。
思いつきでブログ始めてるので、続くかどうかも分からないですが、AI画像生成か美女に興味あれば今後も見にきてやってください。