続・novelAIで遊んでみた

どうも、ねへほもんです。

前回に引き続き、

novelAI

を色々いじっているので、進捗をご報告します。

基本は前回の記事をご参照いただくとして、今回はより上手に使うコツをご紹介します。

novelAIを使う上での最大の問題が、

「どうプロンプトを書いたらいいか分からない！」

というもの。

上手くプロンプトを指定することで、目的のシチュエーションを再現できるのですが、希望を上手く言語化できないとか、そもそもどんなキャラを描きたいかのイメージが湧かないことが多いです。

この3日間、novelAIを使っていて自分なりに使った3つの手法をご紹介します。

1.novelAIの便利機能

まずは便利機能の活用から。

上記のアリスのイラストは「loli, beautiful blue eyes, frilled dress, alice, golden hair, dark night, sky, stars」というプロンプトで生成しました。

が、イラストを見ると指定していない要素が上手く組み合わさっていることが分かります。

カチューシャ→頭が寂しいので丁度良い。かわいい。

靡いた髪→優雅な雰囲気を醸し出す。かわいい。

青いドレス→ブロンドの髪と完璧にマッチする色合い。かわいい。

両脇の☆2つ→starsと指定したが、大きさ・色・配置の場所が完璧。かわいい。

スカートをつまみ上げる動作→禁止カード

とまぁ、僕の好みを知り尽くしたような奇跡的な仕上がりとなりました。

秒速でスマホの待ち受けとTwitterのアイコンが変更されました。

今日までどんなに頑張っても、これを超えるイラストはできていません。

novelAIで生成されるイラストはランダム性があり、同じプロンプトでも試行の度に異なるイラストが出てきます。

偶然「コレ！！！」というキャラが誕生し、そのキャラの表情や仕草を変えたバージョンを生み出そうにも、プロンプトを変えて再試行するだけでは別キャラに変わってしまいます。

そこで使えるのがシード番号です。

イラストの左下に1842343124という番号が書かれていますが、これのことです。

この番号を、右側の「Seed」という欄に入力することで、好みのキャラに固定したまま、プロンプトをいじって表情や仕草を変えることができます。

実際に使用例を後でご紹介します。

なお、上記アリスのイラストは最初期の作品であり、Seedの仕様なんぞ知らない時期だったので、

【悲報】再現不能

です。

まぁ、あれを超える構図は浮かばんし、1点モノの方が価値があるでしょ。

後、健全な当ブログでは詳細には触れませんが、もう1つ便利機能をご紹介します。

NAI Diffussion Anime(Curated)

NAI Diffussion Anime(Full)

NAI Diffussion Furry(Beta)

右上より、上記3つのモードを選択することができます。

初期設定はCuratedですが、Fullに変えるとエッッッッッ！？？？なイラストを生成することができます。

全年齢向けの当ブログでは触れませんが、興味のある方は各自こっそり使ってください。

2.プロンプト調整

先程はランダムに絵を生成して、偶然上手く行ったパターンに固定するという方法をご紹介しましたが、次はプロンプトを工夫し、成功率を高めるというものです。

先人たちの知恵を集めるというもので、僕は2つの方法で情報収集しました。

①Twitter

個人的傑作選です。ALTにプロンプトを記載しています。#NovelAIDiffusion pic.twitter.com/U2R4jAipGx
— ねへほうもん (@nehehomon) October 7, 2022

「novelAI プロンプト」で検索すると、Twitterに画像と共にプロンプトをアップした方がちらほら居ました。

画像の「ALT」と表示されている部分をクリックするとプロンプトが表示される形式が多いので、僕も倣ってみました。

②Danbooru

novelAIの学習データが保存されたサイトです。

このサイトには画像とタグがセットで保存されており、そのタグを読むことでプロンプトのヒントを得られます。

画像とタグをセットで保存するという形式を見て、確かにこれは機械学習に適しているなと思いました。

機械学習では、単に絵を大量に読ませるだけではダメで、各絵にどういう属性が含まれているのかもセットで学習させる必要があります。

例えば、10枚の絵を学習させる時に、前半5枚はロリ、後半5枚はJKだったとします。

この時に、どの絵はロリで、どの絵がJKかを学習させないと、「ロリの絵を出力する」というプロンプトを入力しても、AIはどの絵に近いイラストを生成すれば良いか分かりません。

ロリというタグとセットで学習させることで、ロリというプロンプトに対し、前半5枚に近い絵を出力すれば良いとAIが判断できることになります。

どの絵がロリかといった属性をAIに学習させる方式を「教師あり学習」と言うのですが、画像認識のAI制作においては、学習用の画像データを集めることに加え、各画像に属性情報を登録することが大きな手間となるのです。

novelAIの高精度なアウトプットの裏には、多数のタグ付き画像データという、機械学習に適した環境の存在があったのですね。
(まぁ、無断転載は許されるものではありませんが)

プロンプトの情報収集の話に戻すと、このDanbooruで「Angel wings」とか「Idol」といったタグを入力し、検索にヒットしたイラストを見つつ、自分のイメージに近いイラストのタグを読み込むことで、意図に合うプロンプトのヒントが得られます。

実戦例は後ほど。

③先駆者の記事

Twitter検索の一環で、参考となる情報が得られたのでご紹介しておきます。

#NovelAI #WaifuDiffusion で表情を完全攻略するためのプロンプト辞典 [WIP]｜さいとう｜noteNovelAIやWaifuDiffusionで使用されているDanbooruのタグをまとめました。随時更新します。取り急ぎ目だけ目（引用元：tag group:eyes tags）マンガ的な表現の目 crazy eyes 狂気に満ちた目ヤンデレ empty eyes うつろな目ハイライトのない目 da…

note.com

3.画像追加

「このイラストの背景や仕草が好きだから、この構図と別のキャラを組み合わせたい！」

という時に使えるのがupload imageという機能です。

「eiyuu_densetsu, sora_no_kiseki, renne_(eiyuu_densetsu)」というDanbooruのタグそのままの露骨なプロンプトを入力して、レンちゃんの再現に挑戦しました。

こちらはレンちゃんとは似ませんでしたが、かなりしっくり来た構図でした。

"fetal position" "doll_hug"というプロンプトがポイントで、人形を抱く姿勢でベッドに横たわる様子を描けました。

寝転がってドレスが広がる様子も好みです。

こういう衣装に着られている感じが、より幼さを引き立てるという演出を理解していて偉い。

このままでも良かったのですが、Steps13の節約モードで作成したイラストだったため、より綺麗なイラストにしたいと思い、こちらをアップロードして画像を再出力しました。

あまり変わりませんが、色の鮮やかさに統一感が出た、ベッドの皺がより鮮明になった、生足が隠れてよりロリータ感が出たと微妙に良くなった気がします。

なお、プロンプトは「{{masterpiece}}, loli, eiyuu_densetsu, sora_no_kiseki, renne_(eiyuu_densetsu), purple hair, head_ribbon, lolita_fashion, frilled dress, doll_hug, fetal position, stuffed_bunny」です。

今回は同じキャラの画像更新だったので大した差はありませんが、後で別キャラの構図を持ち込む手法をご紹介します。

4.実戦編

以上3つの便利機能をご紹介したところで、実際に活用してみるとしましょう。

こちらが基本イラストです。

プロンプトは「{{masterpiece}}, loli, small breasts, head_ribbon, battle dress, frilled skirt, frills, precure, magical girl, heart, in magical war, milky way , twintails, smile, one eye closed」です。

こちらのプロンプトをStep33で何度か回してタイプのキャラになったため、まずは1のテクニックである「シード保存」を行いました。

次は「2.プロンプト調整」のテクニックを駆使して、最適な構図を探ります。

ここでプロンプトのご紹介ですが、"one eye closed"でウインクしてくれます。かわいい。