リアルタイムテキスト画像生成モデル「SDXL Turbo」 | らい氏のブックマーク

らい氏のブックマーク

気になったことを書いているブログです。

ちょっと前にStability AIが「日本特化の商用利用可能 text-to-image モデル「Japanese Stable Diffusion XL(JSDXL)」をリリースしたんだけど

 

 

 

(2023.11.17にリリースしました)

 

・JSDXLの特徴 

商用利用可能で日本語入力に対応し、日本の文化やスタイルを反映した画像を生成ができます。

 

こちらからダウンロードできます。

・Hugging Face

link:Japanese Stable Diffusion XL

 

・Google Colab

link:https://colab.research.google.com/github/Stability-AI

 

11/29「SDXL Turbo」をリリースしました。

 

リアルタイムテキスト画像生成モデル「SDXL Turbo」

 

X(旧Twitter)Stability AI 日本公式

 

ブログ:https://ja.stability.ai/blog/sdxl-turbo

 

 

・SDXL Turboの特徴 

SDXL Turbo は、敵対的拡散蒸留(Adversarial Diffusion Distillation:ADD)と呼ばれる新しい蒸留技術に基づいています。この技術により、SDXL Turbo は1つのステップで画像出力を合成し、高いサンプリング忠実度を維持しながらリアルタイムでテキストから画像への出力を生成することができます。

 

ADD を組み込むことで、SDXL Turbo は GAN(Generative Adversarial Networks)に共通する多くの利点(シングルステップの画像出力など)を得ると同時に、他の蒸留手法でよく見られるアーチファクトやぼやけを回避することができます。

 

こちらからダウンロードできます。

 

Hugging Face

link:https://huggingface.co/stabilityai/sdxl-turbo

 

・Clipdrop ベータ版

link:https://clipdrop.co/stable-diffusion-turbo

 

 

 


(感想)

SDXL Turboを遊んでみて、驚いた!

SDXLで日本語入力ができて、生成がそのつど変わるSDXL Turboはマジで速いすごいです。Clipdrop ベータ版で試せれます。

 

 

久しぶりに画像生成をしてみましたが、進化/成長をしているのを感じました。