さるでも使える?DrawThings 

 ~【モデル編】 

 「FLUX.2 (klein) 4B」(8-bit S)を使ってみた

DrawThingsさるでも使える?画像

にっこり

· · ──────── ·✧· ──────── · ·

FLUXシリーズとは

FLUXは、

画像生成AIの先駆者の「Stable Diffusion」

の元主要開発メンバーたちが設立した

ドイツの企業「Black Forest Labs」が開発した画像生成AIモデルです。

にっこり

特徴としては

「圧倒的なプロンプトの理解力」と「破綻のない高画質」

が自慢で

これまでAIが苦手としていた

「指の正確な描写」や「画像内への自然な文字(テキスト)の書き込み」

なんかもわりと簡単にこなして、

Midjourney あたりの有料クローズドAIなんかにも匹敵する

クオリティをローカル環境で実現しています。

にっこり

でもって、

現在、画像生成AI界の新たなスタンダードになっています。←イマココ

· · ──────── ·✧· ──────── · ·

FLUX.2とFLUX.1の違い

にっこり

FLUX.1(第1世代)

2024年リリースのベースモデル。 

テキストからの画像生成(txt2img)に特化しています。

画像の一部を修正する「Inpaint (インペイント)」など

を実行するには専用に派生した別モデル(Fillなど)

を用意する必要がありました。

 

FLUX.2(第2世代)

2025年後半にリリースされた「統合設計」モデル。

テキストからの画像生成、既存の画像編集(img2img)、

複数画像の参照などを

単一のモデルでこなせるようにアーキテクチャが根本から進化しています。

FLUX.1に比べてさらに画質が向上、

生成速度も飛躍的にアップしてるので

ローカル環境でもよりリアルタイムな試行錯誤が可能になりました。

· · ──────── ·✧· ──────── · ·

DrawThings内のFLUXモデル一覧

「公式モデル」+「コミュニティモデル」

 

DrawThings FLUXモデル一覧

(2026年6月時点)

· · ──────── ·✧· ──────── · ·

各用語の解説

にっこり

1. コミュニティ・派生モデル(FLUX.1系)

 Kontext (FLUX.1 Kontext [dev])

 キャラクターの顔や同一性を強力に維持したまま

服装や表情だけを自然に変更したい時に活躍するモデルです。

画像編集に特化したコミュニティ発の強力なツールです。

 

 Krea (FLUX.1 Krea [dev])

 画像生成サービス「Krea AI」との共同開発モデル。

AI特有の「テカった肌」や「過剰な彩度」といった、

いわゆる「AIルック」を徹底的に排除し、

本物の写真と見紛うレベルの超・実写表現に特化しています。

にっこり

 Fill (FLUX.1 Fill [dev])

 画像の一部をなぞって別のものに描き換えたり、背景を自然に広げたりする

「インペイント/アウトペイント」に特化した専用モデルです。

 

2. ライセンス・用途を示す名称

にっこり

(ドイツ語シリーズ)

Black Forest Labsはドイツの企業なので

用語にドイツ語が使われています。

 

 [schnell](シュネル)

 ドイツ語で「速い」の意味。

わずか数ステップで画像を生成できる超高速モデルです。

Apache 2.0ライセンスで提供されており、

商用利用が可能な点も大きなメリットです。

にっこり

 [klein](クライン)

 ドイツ語で「小さい」の意味。

FLUX.2シリーズで新たに登場した超高速・小型モデルです。

1秒未満で画像を生成・編集できる軽快さを持ちながら、

大型モデルに迫る画質を叩き出します。

凝視

 [dev](デブ)←別に太ってるわけではない

 Developer(開発者)の略。

非商用・研究目的で公開されている高品質モデルです。

schnellよりも生成に時間はかかりますが、

プロンプトの再現性や細部のクオリティは最も高くなります。

 

3. サイズ・技術的な仕様を示す名称

にっこり

Draw Thingsで快適に動かすための

「軽量化(量子化)」などに関する用語です。

 

 9B / 4B

Bは、 AIの頭脳の規模を示す「パラメータ数(Billion=10億)」の事です。

「9B」(90億)は高品質ですが、PCのメモリ(VRAM)を多く消費します。

「4B」(40億)は画質を保ちつつも

一般的なMacなどでもサクサク動くように軽量化されたサイズになっています。

にっこり

 KV

 画像生成時のメモリ消費を抑えるため、

「KVキャッシュ」という一時データの処理を最適化したモデルです。

メモリに制限のあるMacやiPhoneで動かすDraw Thingsならではの工夫です。

にっこり

 Base

 軽量化など、「蒸留」されていない「基本(ベース)モデル」。

そのまま画像生成に使うというよりは、

自分好みの画風を追加学習(LoRA作成等)させる際の土台として使われます。

にっこり

 (Exact)

 データの圧縮(量子化)を行わず、

オリジナルの重みデータを正確(Exact)な精度のまま保持しているモデルです。

画質は最高ですが、ファイルサイズが非常に大きく、

メモリも大量に消費します。

にっこり

 (8-bit S) / (6-bit) / (5-bit)

 モデルの容量を圧縮する「量子化」の度合いです。

数字が小さいほどファイルサイズが軽く、低スペックな端末でも動きますが、

ごくわずかに画質が低下する可能性があります。

(8-bit Sの「S」は対称量子化という処理方式を指します)。

· · ──────── ·✧· ──────── · ·

今回使用したモデルは

「FLUX.2 (klein) 4B」(8-bit S)です。

(スペックの関係でこれ1択になります)

 

今回は比較のため、

前回と同じ

「女性剣士」

「イケメン魔術師」

でいってみます

ニコニコ

プロンプトも前回と同じものを使用しました。

にっこり

· · ──────── ·✧· ──────── · ·

最初は「女性剣士」です

騎士風の少女、大剣を構え夕空を背景に立つ

 何?!

オエー

この左手に持ってる武器は…?!

驚き

画像生成過程で

多分、剣頭の「ポンメルとグリップ」がベルト化しちゃったん

だと思うけど、

凝視

剣とクレーバーの中間系武器イラスト

一応、復元してみたw

ニコニコ

ブレード(剣)とクレーバー(肉切り包丁)の中間系みたいな感じ。

押しつけて切断するタイプかな?

振り回すのはちょっと無理かも…。

ネガティブ

てか、どうでもいいです。

 · · ────────·✧·──────── · ·

次は「イケメン魔術師」です!

魔法使いが図書館で古書を読む

こちらは、魔術書がキチンと生成されなくて、

 何回かガチャしました。

あと魔法円(陣)がきちんと生成されない。

(因みに本来の魔法円は、召喚した死者や悪霊から術者の身を守る為の結界です)

驚き

でも

生成速度は

めちゃ早いです!

にっこり

画像もキレイなんですけど

結構、ガチャしないとなかなか正解が出ないのが難点です…。

凝視

 

  続く(多分)。

 

ふとん1ふとん2ふとん3

 

 おしまい。

 · · ──────── ·✧· ──────── · ·

参考資料

「女性剣士」英語プロンプト

(前回と同じです)

This is a high-quality illustration inspired by fantasy animation.

The image depicts a young,

charming female swordswoman bathed in the afterglow of twilight.

This young woman, in her early twenties,

wears her long golden hair in twin ponytails that flutter in the breeze.

She is clad in fantasy-style armor that combines practicality with beauty,

with every detail meticulously crafted.

The silver plate mail and blue leather armor blend beautifully, and her white cloak flutters in the breeze.

A greatsword engraved with blue runes hangs at her waist,

its blade sheathed in an ornate scabbard. She wears slightly worn leather gloves and grips the sword's hilt firmly.

She stands atop a rugged, rocky mountain dotted with ancient ruins.

In the background, the sunset-drenched sky blends from orange to purple, and above the distant sea of clouds, the outline of a fantastical city faintly emerges.

Magical particles sparkle in the air, creating a dreamlike, ethereal atmosphere.

The colors are vivid and rich, and the art style is as delicate as traditional hand-drawn animation.

Thanks to cinematic-quality lighting and shadow effects created using backlighting techniques, the characters' silhouettes are beautifully rendered.

This finished scene looks just like a frame from an animated film and is breathtakingly beautiful.

 

ネガティブ・プロンプト

photorealistic, realistic, photograph, highly detailed skin, realistic features, excessive texture, busy background, 3d render, low resolution, bad anatomy, flat colors, blurred background.

· · ──────── ·✧· ──────── · ·

テキストから画像生成

モデル:FLUX.2 [klein] 4B (8-bit S)

ステップ数:10

テキストガイダンス:1.0

強度:100%

サンプラー:DDIM Trailing

シードモード:スケール類似

シフト: 3.00

· · ──────── ·✧· ──────── · ·

関連記事

↓↓↓

 

 · · ──────── ·✧· ──────── · ·

【障害報告】

もしかしたら

いつもはランキング上位のあなたも

今日は圏外までぶっ飛んでるかも

?!

驚き

↓↓↓