どうも、ねへほもんです。
前回に引き続き、
novelAI
を色々いじっているので、進捗をご報告します。
基本は前回の記事をご参照いただくとして、今回はより上手に使うコツをご紹介します。
novelAIを使う上での最大の問題が、
「どうプロンプトを書いたらいいか分からない!」
というもの。
上手くプロンプトを指定することで、目的のシチュエーションを再現できるのですが、希望を上手く言語化できないとか、そもそもどんなキャラを描きたいかのイメージが湧かないことが多いです。
この3日間、novelAIを使っていて自分なりに使った3つの手法をご紹介します。
1.novelAIの便利機能
まずは便利機能の活用から。
上記のアリスのイラストは「loli, beautiful blue eyes, frilled dress, alice, golden hair, dark night, sky, stars」というプロンプトで生成しました。
が、イラストを見ると指定していない要素が上手く組み合わさっていることが分かります。
カチューシャ→頭が寂しいので丁度良い。かわいい。
靡いた髪→優雅な雰囲気を醸し出す。かわいい。
青いドレス→ブロンドの髪と完璧にマッチする色合い。かわいい。
両脇の☆2つ→starsと指定したが、大きさ・色・配置の場所が完璧。かわいい。
スカートをつまみ上げる動作→禁止カード
とまぁ、僕の好みを知り尽くしたような奇跡的な仕上がりとなりました。
秒速でスマホの待ち受けとTwitterのアイコンが変更されました。
今日までどんなに頑張っても、これを超えるイラストはできていません。
novelAIで生成されるイラストはランダム性があり、同じプロンプトでも試行の度に異なるイラストが出てきます。
偶然「コレ!!!」というキャラが誕生し、そのキャラの表情や仕草を変えたバージョンを生み出そうにも、プロンプトを変えて再試行するだけでは別キャラに変わってしまいます。
そこで使えるのがシード番号です。
イラストの左下に1842343124という番号が書かれていますが、これのことです。
この番号を、右側の「Seed」という欄に入力することで、好みのキャラに固定したまま、プロンプトをいじって表情や仕草を変えることができます。
実際に使用例を後でご紹介します。
なお、上記アリスのイラストは最初期の作品であり、Seedの仕様なんぞ知らない時期だったので、
【悲報】再現不能
です。
まぁ、あれを超える構図は浮かばんし、1点モノの方が価値があるでしょ。
後、健全な当ブログでは詳細には触れませんが、もう1つ便利機能をご紹介します。
NAI Diffussion Anime(Curated)
NAI Diffussion Anime(Full)
NAI Diffussion Furry(Beta)
右上より、上記3つのモードを選択することができます。
初期設定はCuratedですが、Fullに変えるとエッッッッッ!???なイラストを生成することができます。
全年齢向けの当ブログでは触れませんが、興味のある方は各自こっそり使ってください。
2.プロンプト調整
先程はランダムに絵を生成して、偶然上手く行ったパターンに固定するという方法をご紹介しましたが、次はプロンプトを工夫し、成功率を高めるというものです。
先人たちの知恵を集めるというもので、僕は2つの方法で情報収集しました。
①Twitter
個人的傑作選です。ALTにプロンプトを記載しています。#NovelAIDiffusion pic.twitter.com/U2R4jAipGx
— ねへほうもん (@nehehomon) October 7, 2022
「novelAI プロンプト」で検索すると、Twitterに画像と共にプロンプトをアップした方がちらほら居ました。
画像の「ALT」と表示されている部分をクリックするとプロンプトが表示される形式が多いので、僕も倣ってみました。
novelAIの学習データが保存されたサイトです。
無断転載らしいので、画像は含めずリンクだけ貼っておきます。
このサイトには画像とタグがセットで保存されており、そのタグを読むことでプロンプトのヒントを得られます。
画像とタグをセットで保存するという形式を見て、確かにこれは機械学習に適しているなと思いました。
機械学習では、単に絵を大量に読ませるだけではダメで、各絵にどういう属性が含まれているのかもセットで学習させる必要があります。
例えば、10枚の絵を学習させる時に、前半5枚はロリ、後半5枚はJKだったとします。
この時に、どの絵はロリで、どの絵がJKかを学習させないと、「ロリの絵を出力する」というプロンプトを入力しても、AIはどの絵に近いイラストを生成すれば良いか分かりません。
ロリというタグとセットで学習させることで、ロリというプロンプトに対し、前半5枚に近い絵を出力すれば良いとAIが判断できることになります。
どの絵がロリかといった属性をAIに学習させる方式を「教師あり学習」と言うのですが、画像認識のAI制作においては、学習用の画像データを集めることに加え、各画像に属性情報を登録することが大きな手間となるのです。
novelAIの高精度なアウトプットの裏には、多数のタグ付き画像データという、機械学習に適した環境の存在があったのですね。
(まぁ、無断転載は許されるものではありませんが)
プロンプトの情報収集の話に戻すと、このDanbooruで「Angel wings」とか「Idol」といったタグを入力し、検索にヒットしたイラストを見つつ、自分のイメージに近いイラストのタグを読み込むことで、意図に合うプロンプトのヒントが得られます。
実戦例は後ほど。
③先駆者の記事
Twitter検索の一環で、参考となる情報が得られたのでご紹介しておきます。
3.画像追加
「このイラストの背景や仕草が好きだから、この構図と別のキャラを組み合わせたい!」
という時に使えるのがupload imageという機能です。
「eiyuu_densetsu, sora_no_kiseki, renne_(eiyuu_densetsu)」というDanbooruのタグそのままの露骨なプロンプトを入力して、レンちゃんの再現に挑戦しました。
こちらはレンちゃんとは似ませんでしたが、かなりしっくり来た構図でした。
"fetal position" "doll_hug"というプロンプトがポイントで、人形を抱く姿勢でベッドに横たわる様子を描けました。
寝転がってドレスが広がる様子も好みです。
こういう衣装に着られている感じが、より幼さを引き立てるという演出を理解していて偉い。
このままでも良かったのですが、Steps13の節約モードで作成したイラストだったため、より綺麗なイラストにしたいと思い、こちらをアップロードして画像を再出力しました。
あまり変わりませんが、色の鮮やかさに統一感が出た、ベッドの皺がより鮮明になった、生足が隠れてよりロリータ感が出たと微妙に良くなった気がします。
なお、プロンプトは「{{masterpiece}}, loli, eiyuu_densetsu, sora_no_kiseki, renne_(eiyuu_densetsu), purple hair, head_ribbon, lolita_fashion, frilled dress, doll_hug, fetal position, stuffed_bunny」です。
今回は同じキャラの画像更新だったので大した差はありませんが、後で別キャラの構図を持ち込む手法をご紹介します。
4.実戦編
以上3つの便利機能をご紹介したところで、実際に活用してみるとしましょう。
こちらが基本イラストです。
プロンプトは「{{masterpiece}}, loli, small breasts, head_ribbon, battle dress, frilled skirt, frills, precure, magical girl, heart, in magical war, milky way , twintails, smile, one eye closed」です。
こちらのプロンプトをStep33で何度か回してタイプのキャラになったため、まずは1のテクニックである「シード保存」を行いました。
次は「2.プロンプト調整」のテクニックを駆使して、最適な構図を探ります。
ここでプロンプトのご紹介ですが、"one eye closed"でウインクしてくれます。かわいい。
こちらが"one eye closed"無しバージョンです。
僕はウインクしている方が好みです。
"surprised", "wide eyed"を追加しました。
僕的にはあざとく感じますが、こういうテクニックもあります。
あまり違いを感じないかもしれませんが、"wind lift"を追加しました。
少しスカートが吹き上げられているのがお分かりでしょうか・・・?
"wind lift", "white underwear"を追加しました。
誰だよ健全な当ブログって書いた奴
"skirt hold"を追加しました。
冒頭のアリスでも触れましたが、お上品な感じがして好きなんですよね。
プロンプトで色々微調整が出来ることが分かったところで、最後に「3.画像追加」のテクニックを使ってみましょう。
こちらのイラストをアップロードして、このイラストの構図を上記のキャラに当てはめてみました。
こちら、「十六夜のフォルトゥーナ」という恋愛シミュレーションゲームの汐宮ルシアというキャラです。
僕はFripSideの曲が好きで、その中でも「Fortuna on the Sixteenth Night」という曲が大好きなのですが、曲が好き過ぎるあまりゲームも買ってしまいました。
神曲です。
宮坂みゆ先生の優しい感じのキャラデザとか、教会を中心とした田舎の町というシチュエーションもハマり、僕好みのゲームでした。どうでもいいですが、僕は冬月時雨派です。
ゲームの話に脱線してしまいましたが、僕は女の子が目を閉じて祈る仕草が好きで、特にOPムービーのルシアの神々しい姿がドンピシャです。こちらの構図をAIイラスト生成に活用してみました。
結果はこちらです。
祈ってないけど・・・かわいぃいぃぃぃぃ
こちらは横長の絵ということで、PCの壁紙になりました。
一応プロンプトに"praying""closed eyes"を追加したのですが、手を合わせて祈る様子は難しいんですかね。
ただ、背景が良い感じにぼやけて、女の子の鮮明さをより引き立たせる演出はAIながら巧みだと感じました。
好みの構図に仕上がることは嬉しいのですが、AIに好みを知り尽くされていると思うと少し悔しいです。
後、この記事で僕の性癖を全公開していると思うと恥ずかしくなります。
まぁこの歳になると恥じることなんて何も無いさ。
以上、novelAIの活用事例でした。
10ドル使ってでも推しを生み出したい!という方に参考になれば幸いです。
では(^^)/