リアルタイムテキスト画像生成モデル「SDXL Turbo」

ちょっと前にStability AIが「日本特化の商用利用可能 text-to-image モデル「Japanese Stable Diffusion XL(JSDXL)」をリリースしたんだけど

(2023.11.17にリリースしました)

・JSDXLの特徴　

商用利用可能で日本語入力に対応し、日本の文化やスタイルを反映した画像を生成ができます。

こちらからダウンロードできます。

・Hugging Face

link：Japanese Stable Diffusion XL

・Google Colab

link：https://colab.research.google.com/github/Stability-AI

11/29「SDXL Turbo」をリリースしました。

リアルタイムテキスト画像生成モデル「SDXL Turbo」

X(旧Twitter)Stability AI 日本公式

SDXL Turboのご紹介：リアルタイムテキスト画像生成モデル。

SDXL Turboは、新しい蒸留技術によって最先端のパフォーマンスを実現し、必要なステップ数を50からわずか1へと削減することで、これまでにない品質のシングルステップ画像生成を可能にします。… pic.twitter.com/TZlZwglSyc
— Stability AI 日本公式 (@StabilityAI_JP) November 28, 2023

ブログ：https://ja.stability.ai/blog/sdxl-turbo

・SDXL Turboの特徴　

SDXL Turbo は、敵対的拡散蒸留（Adversarial Diffusion Distillation：ADD）と呼ばれる新しい蒸留技術に基づいています。この技術により、SDXL Turbo は1つのステップで画像出力を合成し、高いサンプリング忠実度を維持しながらリアルタイムでテキストから画像への出力を生成することができます。

ADD を組み込むことで、SDXL Turbo は GAN（Generative Adversarial Networks）に共通する多くの利点（シングルステップの画像出力など）を得ると同時に、他の蒸留手法でよく見られるアーチファクトやぼやけを回避することができます。

こちらからダウンロードできます。

・Hugging Face

link：https://huggingface.co/stabilityai/sdxl-turbo

・Clipdrop ベータ版

link：https://clipdrop.co/stable-diffusion-turbo

(感想）

SDXL Turboを遊んでみて、驚いた！

SDXLで日本語入力ができて、生成がそのつど変わるSDXL Turboはマジで速いすごいです。Clipdrop ベータ版で試せれます。

久しぶりに画像生成をしてみましたが、進化/成長をしているのを感じました。

らい氏のブックマーク

気になったことを書いています。

リアルタイムテキスト画像生成モデル「SDXL Turbo」