Ubuntu 24.04LTSで生成AIを使って画像生成、文章作成、音楽制作まで、クリエイティブの可能性を広げるAIツールの魅力について、最近ハマっているこの生成AIについて、ぜひ皆さんにもご紹介したく、かんたんにご紹介をさせていただきます。
1. 【AIが創造性を解き放つ!】生成AIとは?
近年、AI技術の飛躍的な進歩により、生成AIと呼ばれる新たなAIツールが注目を集めています。従来のAIとは異なり、画像や文章、音楽、コードなどを生成することができ、クリエイティブな分野での可能性を大きく広げています。
2. 【Ubuntuで使える!】注目の生成AIツール
Ubuntuには、様々な生成AIツールが用意されています。代表的なツールとその特徴をご紹介します。
・Stable Diffusion: 高画質な画像生成に特化
・Dream by WOMBO: 簡単操作でユニークな画像生成
・GauGAN2: 写真と絵画の融合で幻想的な作品作り
・BARD: 文章生成、翻訳、コード生成など多機能
・MuseNet: AIによる作曲でオリジナル楽曲制作
3. 【画像生成の革命児!】Stable Diffusionの魅力
Stable Diffusionは、高画質な画像生成に特化した生成AIツールです。写真のようなリアルな画像から、芸術的な抽象画まで、幅広い画像を生成することができます。
メリット:
・高画質な画像生成が可能
・複雑な構図や抽象的な表現も生成できる
・テキストベースで指示を与えるため、思い通りの画像を生成しやすい
・オープンソースで利用無料 <= ここが大きなポイント
デメリット:
・高性能なGPUが必要(私はのRTX 4070ti SUPER OC 12GB使っています。高かったです; ; )
・生成に時間がかかる場合がある
・生成対象によっては電力をかなり消費します。
(CPU:Ryzen 9 5900X , メモリ:64GBで生成AIフル稼働中は、500W近く使用しています。)
・倫理的に問題のある画像生成も可能(これは、イレギュラーで生成されてしまうものが多々あります。これを修正していく手間はかかりますが、下記の拡張機能の中には、修正のためのツール群も別途追加機能として組み込むことができます。)
おすすめポイント:
・独創的なアート作品作りに最適
・画像素材作成にも活用できる
・研究目的にも利用できる
4. 【簡単インストール!】Stable Diffusionの導入方法
Stable Diffusionは、以下の手順で簡単にインストールできます。
※概略となります。当ツールは既に先人の方々がいろいろと公開されていますので(検索すると沢山出てきます)、同様のことを記載しても無駄であることから、あくまでもインストールの手順(流れ)を説明させていただきます。
①Google Colabなどのクラウド環境を用意する、またはローカルで動作させる場合は1TB以上のSSD/HDD
②NVIDIAのグラボを用意。
③Pythonがインストールされていない場合は、別途インストール
※Ubuntu 24.04LTSでは、デフォルトで入っていますが、念の為に以下で確認をしてください。
$ python3 --version
④Stable Diffusionの公式リポジトリをクローンする
⑤必要なライブラリをインストールする
※インストールデレクトリ(stable-diffusion-webui配下)にある、webui.shを実行
$ ./webui.sh
※これには時間が少々かかります。
⑥Stable Diffusionの起動
念の為に、
$ chmod a+x webui.sh
は事前に実行しておいたほうがよろしいかと
⑦起動方法は、
・上記のコマンドをターミナルから入力
・マウスにて、上記のコマンドをダブルクリック
起動すると、次のような画面がブラウザが立ち上がって表示されます。
(このUI画面は、日本語に設定しています。拡張機能から追加で可能となります。)
5. 【無限の可能性!】Stable Diffusionの使い方
Stable Diffusion起動後は、以下の手順で画像を生成することができます。
・テキストプロンプトを作成する (例: 猫が星空を飛んでいる。できれば英語の方が精度が上がります。)
・モデルを選択する
・生成ボタンを押す
プロンプトとは:
生成したい画像のイメージを伝えるためのテキストのこと。具体的な内容や指示を盛り込むことで、より思い通りの画像を生成することができます。
プロンプトを使った生成AIの画像例:
・猫が星空を飛んでいる
・幻想的な風景
・未来都市
・ロボットと人間の共存
プロンプトの入力例
猫が星空を飛んでいる,幻想的な風景,未来都市,ロボットと人間の共存
これが生成AIで作成です。これは実在しないもので、全て我が家のPCで作成した画像となります。
6.【もっと遊びたい!】拡張機能でStable Diffusionを拡張
Stable Diffusionには、様々な拡張機能が用意されています。拡張機能を利用することで、より高度な画像生成や、新たな機能を追加することができます。
拡張機能とは:
Stable Diffusionの基本機能を拡張するツールのこと。様々な種類の拡張機能があり、用途に合わせてインストールすることができます。
どのような拡張機能があるか:
・生成速度を向上させる拡張機能
・特定のスタイルの画像を生成する拡張機能
・生成結果を編集する拡張機能
・生成過程を可視化する拡張機能
おすすめ拡張機能:
①Control Netの主な機能
- 特定の領域をブラシで描く
- 描いた領域のディテールや色合いを調整
- 複数のブラシを使い分ける
- マスクを使って複雑な編集を行う
Control Netを使うことで:
- 人物の顔や髪型を修正する
- 風景にオブジェクトを追加する
- 画像の質感や色合いを調整する
- 複数の画像を合成する
など、様々な高度な編集が可能になります。
② Lama cleaner: 生成画像のノイズを除去
Lama cleanerは、生成された画像のノイズを除去する拡張機能です。画像に発生しがちなアーティファクトや
ノイズを自動的に除去し、よりクリーンで美しい画像に仕上げることができます。
特に、人物の顔や細かい部分のノイズ除去に効果を発揮します。
Lama cleanerの主な機能:
- 画像全体のノイズを自動的に除去
- 特定の領域のノイズをピンポイントで除去
- ノイズ除去の強さを調整
- 複数のノイズ除去方法を選択
Lama cleanerを使うことで:
- 生成画像の質を向上させる
- よりリアルな画像に仕上げる
- 印刷や商用利用に適した画像を作成する
③ Canvas Zoom: 画像を拡大・縮小して細かい部分まで編集
Canvas Zoomは、生成画像を拡大・縮小できる拡張機能です。
画像の一部を拡大して細かい部分まで編集したり、ブラシのサイズを調整したりすることができます。
Control Netと組み合わせることで、より精度の高い編集が可能になります。
Canvas Zoomの主な機能:
- 画像を自由に拡大・縮小
- ブラシのサイズを調整
- 複数のズームレベルを記憶
- 全画面表示
Canvas Zoomを使うことで:
- 人物の目や髪の毛などの細かい部分まで編集
- 複雑な模様やテクスチャを作成
- 画像の一部を強調して印象的な作品に仕上げる
生成AIは、様々な分野で活用されています。
・アート作品制作: 独創的なアート作品作り
・画像素材作成: 商用利用可能な画像素材作成
・製品デザイン: 新しい製品デザインのアイデア出し
・教育: わかりやすい教材作成
・エンターテイメント: ゲームやバーチャルリアリティコンテンツ制作
8. 【未来を切り拓くAI!】これからの社会にとっての生成AI
生成AIは、私たちの生活を大きく変革する可能性を秘めた技術です。