2026.01.13i 成人の日の生成AIと圧倒的休日感 | れびりんす

れびりんす

人生という迷宮と向き合う日々の記録と記憶と何か。

昨日は成人の日だった。

家族でマックにランチ、そこから一人行動を好む長男は散歩しながら帰宅、徒歩約30分程度。

次男は祝日だけど支援系施設でのお仕事的作業があるので、そこまで送迎ドライブ。

奥さんと三男は、奥さんの実家のじいじのところへ遊びに行くとのことで、追加送迎ドライブ。

という流れで、二つの送迎を終えた私は一人で気ままに音楽を掛けて帰宅の途へ。

この瞬間の圧倒的な休日と幸福感。

 

さて、本日はもう一つ、AIのお話を。

30年以上に渡る創作活動の転記が、AI時代に訪れているのではないかと感じている。

先日書いた節目感の要因の一つとしてこの感覚はありそうな気がしている。

 

振り返り過ぎると無駄な長文化が避けられないので簡易的に。

1993年とかのテキストが残っていることから、10代中盤辺りが最古のデータだ。

これは私自身の記憶とも合致する。

多分16歳とかその辺りで、自分だけの脳内創造世界の魅力に気付いた。

10代後半から20代中盤に掛けては、これをいかに具現化するか、をバイト・仕事の傍ら考える取り組みを行っていた。

その頃の結論はゲームという形式でのアウトプットを目指したのだけれど、一人で何らかのゲームを作るならそこには当然物語が必要なわけでその頃からぽつぽつと自作の物語を書き始めるわけだ。

設定厨かと思うほどの設定データはあるし、キャラクターも多数生み出しているし、当時の絵もあれば、それを撮影したデータもいくつか存在している。

音楽は自作しなくてもネットの海に転がっているだろうと当時から思っていた。

拾い物で賄えないだろうから、と必要スキルとして身につけようと決めたのがプログラムだったことも後押ししてIT業界に進むことを決めた、という経緯もある。

根拠は希薄ながら、自分の性質上ITは向くであろうという読みがあり、それが正しかったかどうかは知るところではないが、今もIT業界に勤めて元気に生きていることから少なくとも間違いではなかったと信じている。

さて、ゲームを作るにしてもすべてを一人で、というのは難しいかなと思いWebで人を募り、コミュニティ的にチームを作ってはみたもののどれだけ説明しても、私の気持ちや意図は完全には伝わらない。

伝わらないどころか、誤解を招き、不和を生み、という経験はとても貴重であったがチームは簡単に瓦解、自然崩壊した。

さすがにゲームはその時点で断念している。

悪あがきで一人でサウンドノベルを作りかけて、序盤のちょっとだけ動くものとかがまだ手元にあって、なかなか自分のしぶとさが形になっていて微笑ましい。

 

そこからも自分の中での世界創造は途切れることなく、未だに続いている。

多数の設定ファイルが増え続け、物語は生み出され続け、少しずつ10代の少年当時の自分が考えていたものがブラッシュアップされた結果、物語の形式もドファンタジーから現実と幻想の狭間を目指すような形にシフトしたりなどの変化も生まれた。

人生の90%は仕事だったのではないかと思うほど、必死に仕事をしてきたから、創作継続とは言うもののその活動は低空飛行であり細々としていて、よくやめなかったものだなと我ながら思う。

オリジナリティに重きを置く気質があるから、崩壊したチームメンバーの何人かに伝わらなかった理由の一つとして、創作活動と銘打った際にそれが二次創作モノだと思われたことはとても衝撃的で、自分としては創作=一次創作だった(当時は一次二次といった概念すら知らなかった)ことも大きな出来事だったと言える。

絵は見るのも描くのも好きなのだけれど、そんな低空、ほっそり活動の中では描き続けることが困難だったから、ふと思いついた時に書く設定ファイルと定期的に必ず書くと決めて続けて来た物語のテキストだけが増え続けて今に至っているというわけだ。

最終的に何らかのアウトプットの形を模索し続けているが、それが未熟な文章のテキストを公開するWebであると考えているわけでもないから、AIの登場は革新的である、と個人的に思うところなのだ。

 

未だAIを使ってどのようなものを生み出すかというのは対話をしながら検討中なのだけれど、一つには物語のある場面を切り取ったスナップショットを継続的に生み出してはどうか、という提案がその中にあり、試し始めている。

これは自分や近しい誰かに向けた遺書の一環でもあることを踏まえた記録でもあるので、今を切り取ってスナップショットの練習台に現実を利用しつつ、説明してみようと思った次第だ。

使うAIはAdobe Fireflyの画像生成機能で、そのプロンプトをChatGPTやGeminiに英語かつ適切な文脈を考えてもらう構成を今は試している。

Adobeは業務的にそんなに使ってもいないのに個人契約を続けていて、まあいいかと高額な支払いを10年以上も続けていたのだけど、偶然か必然か今このタイミングでとても有意義に活用している。

画像生成の際に選択できるモデルの中で5種類ほどを試して傾向を把握しようとしているので、今回も次の5種類での生成結果を載せておく。

使用モデル:「Firefly Image 5(Preview)」「Firefly Image 4 Ultra」「GPT Image 1.5」「Gemini 3 (w/NanoBanana Pro)」「FLUX.2」

 

そして序盤に記載した日常、圧倒的休日感を表すために考えたテキストは下記の通り。

「成人の日に一人でワンボックスカーを運転している。運転席からの景色で、グレーのシャツを着ていて黒い革手袋を着用、タバコを吸いながら窓を開けている。景色は都会過ぎず田舎過ぎない日常の景色だけど、道行く人は休日を楽しんでいたり、成人の日のため振袖を来た女性とその家族などが見受けられる。空は晴天、肌寒いが気持ちが良い。社内には音楽が流れている。運転者の視点。」

これをChatGPTとGeminiにそれぞれ”Adobe Fireflyにスナップショットとして描いてもらうための適切な英語プロンプトにしてみて”と依頼する。

ChatGPTもGeminiも今色々対話してみているところだから、過去の文脈なども影響しているかもしれないけれど、それぞれに提示してきたプロンプトは以下の通り。

ChatGPT:

English Prompt (for Adobe Firefly):

A realistic snapshot from the driver’s point of view inside a one-box car on Coming of Age Day in Japan.
The driver is wearing a gray shirt and black leather gloves, holding the steering wheel with one hand, smoking a cigarette while the window is open.
The view shows an everyday Japanese town, neither too urban nor too rural.
Outside, people are enjoying their holiday; some families are walking together, and young women wearing colorful furisode kimono for Coming of Age Day can be seen on the street.
It is a clear sunny day, slightly cold but refreshing.
Soft daylight fills the car interior, and music is playing quietly inside the vehicle.
Calm, natural, documentary-style photography, realistic lighting, no dramatic effects.

Gemini:

English Prompt for Adobe Firefly:

A candid photograph from the driver's perspective inside a minivan on a sunny, crisp winter day. A hand wearing a black leather glove holds a lit cigarette, resting on the open window frame. The sleeve of a gray shirt is visible. Outside, a suburban street scene in Japan unfolds on Coming of Age Day. Young women in colorful furisode kimonos walk with their families, and other pedestrians stroll leisurely. The sky is clear blue. The van's dashboard and steering wheel are partially visible.

これを前述の5モデルでAdobe Fireflyに生成させてみる。

こんな感じ。

なぜか、GeminiのプロンプトをFLUXで生成しようとした時だけプロンプトNGが出たんだけどタバコ(cigarette)辺りがダメだったんだろうか。

ということで、もう十分文章長すぎなのでこの結果についての語りはやめとく。

実体験を基にした日常場面のスナップショットだから、イメージした絵(実体験)との差異がとてもわかる。

 

Prompt(ChatGPT) x Model(Firefly Image 5 Preview):

Prompt(ChatGPT) x Model(Firefly Image 4 Ultra):

Prompt(ChatGPT) x Model(GPT Image 1.5):

Prompt(ChatGPT) x Model(Gemini 3 w/NanoBanana Pro):

Prompt(ChatGPT) x Model(FLUX.2):

 

Prompt(Gemini) x Model(Firefly Image 5 Preview):

Prompt(Gemini) x Model(Firefly Image 4 Ultra):

Prompt(Gemini) x Model(GPT Image 1.5):

Prompt(Gemini) x Model(Gemini 3 w/NanoBanana Pro):