Ubuntu 24.04LTSで生成AIを使って画像生成、文章作成、音楽制作まで、クリエイティブの可能性を広げるAIツールの魅力について、最近ハマっているこの生成AIについて、ぜひ皆さんにもご紹介したく、かんたんにご紹介をさせていただきます。



1. 【AIが創造性を解き放つ!】生成AIとは?

近年、AI技術の飛躍的な進歩により、生成AIと呼ばれる新たなAIツールが注目を集めています。従来のAIとは異なり、画像や文章、音楽、コードなどを生成することができ、クリエイティブな分野での可能性を大きく広げています。

2. 【Ubuntuで使える!】注目の生成AIツール

Ubuntuには、様々な生成AIツールが用意されています。代表的なツールとその特徴をご紹介します。

・Stable Diffusion: 高画質な画像生成に特化
・Dream by WOMBO: 簡単操作でユニークな画像生成
・GauGAN2: 写真と絵画の融合で幻想的な作品作り
・BARD: 文章生成、翻訳、コード生成など多機能
・MuseNet: AIによる作曲でオリジナル楽曲制作

3. 【画像生成の革命児!】Stable Diffusionの魅力

Stable Diffusionは、高画質な画像生成に特化した生成AIツールです。写真のようなリアルな画像から、芸術的な抽象画まで、幅広い画像を生成することができます。

メリット:

・高画質な画像生成が可能
・複雑な構図や抽象的な表現も生成できる
・テキストベースで指示を与えるため、思い通りの画像を生成しやすい
・オープンソースで利用無料    <=  ここが大きなポイント

デメリット:

 

・高性能なGPUが必要(私はのRTX 4070ti SUPER OC 12GB使っています。高かったです; ; )
・生成に時間がかかる場合がある
・生成対象によっては電力をかなり消費します。
 (CPU:Ryzen 9 5900X , メモリ:64GBで生成AIフル稼働中は、500W近く使用しています。)
・倫理的に問題のある画像生成も可能(これは、イレギュラーで生成されてしまうものが多々あります。これを修正していく手間はかかりますが、下記の拡張機能の中には、修正のためのツール群も別途追加機能として組み込むことができます。)


おすすめポイント:

・独創的なアート作品作りに最適
・画像素材作成にも活用できる
・研究目的にも利用できる

4. 【簡単インストール!】Stable Diffusionの導入方法

Stable Diffusionは、以下の手順で簡単にインストールできます。
※概略となります。当ツールは既に先人の方々がいろいろと公開されていますので(検索すると沢山出てきます)、同様のことを記載しても無駄であることから、あくまでもインストールの手順(流れ)を説明させていただきます。
 

①Google Colabなどのクラウド環境を用意する、またはローカルで動作させる場合は1TB以上のSSD/HDD

②NVIDIAのグラボを用意。
③Pythonがインストールされていない場合は、別途インストール
※Ubuntu 24.04LTSでは、デフォルトで入っていますが、念の為に以下で確認をしてください。

$ python3 --version
 
④Stable Diffusionの公式リポジトリをクローンする

⑤必要なライブラリをインストールする
※インストールデレクトリ(stable-diffusion-webui配下)にある、webui.shを実行
 

$ ./webui.sh

 

※これには時間が少々かかります。


⑥Stable Diffusionの起動

 

念の為に、

 

$ chmod a+x webui.sh

 

は事前に実行しておいたほうがよろしいかと



⑦起動方法は、

・上記のコマンドをターミナルから入力
・マウスにて、上記のコマンドをダブルクリック
起動すると、次のような画面がブラウザが立ち上がって表示されます。

(このUI画面は、日本語に設定しています。拡張機能から追加で可能となります。)

 

 


5. 【無限の可能性!】Stable Diffusionの使い方

Stable Diffusion起動後は、以下の手順で画像を生成することができます。

・テキストプロンプトを作成する (例: 猫が星空を飛んでいる。できれば英語の方が精度が上がります。)
・モデルを選択する
・生成ボタンを押す


プロンプトとは:

生成したい画像のイメージを伝えるためのテキストのこと。具体的な内容や指示を盛り込むことで、より思い通りの画像を生成することができます。

プロンプトを使った生成AIの画像例:

・猫が星空を飛んでいる
・幻想的な風景
・未来都市
・ロボットと人間の共存

プロンプトの入力例
猫が星空を飛んでいる,幻想的な風景,未来都市,ロボットと人間の共存

 

これが生成AIで作成です。これは実在しないもので、全て我が家のPCで作成した画像となります。



6.【もっと遊びたい!】拡張機能でStable Diffusionを拡張

Stable Diffusionには、様々な拡張機能が用意されています。拡張機能を利用することで、より高度な画像生成や、新たな機能を追加することができます。

拡張機能とは:

Stable Diffusionの基本機能を拡張するツールのこと。様々な種類の拡張機能があり、用途に合わせてインストールすることができます。

どのような拡張機能があるか:

・生成速度を向上させる拡張機能
・特定のスタイルの画像を生成する拡張機能
・生成結果を編集する拡張機能
・生成過程を可視化する拡張機能

おすすめ拡張機能:

 

①Control Netの主な機能

  • 特定の領域をブラシで描く
  • 描いた領域のディテールや色合いを調整
  • 複数のブラシを使い分ける
  • マスクを使って複雑な編集を行う

 Control Netを使うことで:

  • 人物の顔や髪型を修正する
  • 風景にオブジェクトを追加する
  • 画像の質感や色合いを調整する
  • 複数の画像を合成する

 など、様々な高度な編集が可能になります。

 

② Lama cleaner: 生成画像のノイズを除去

 Lama cleanerは、生成された画像のノイズを除去する拡張機能です。画像に発生しがちなアーティファクトや

 ノイズを自動的に除去し、よりクリーンで美しい画像に仕上げることができます。

 特に、人物の顔や細かい部分のノイズ除去に効果を発揮します。

 

 Lama cleanerの主な機能:

  • 画像全体のノイズを自動的に除去
  • 特定の領域のノイズをピンポイントで除去
  • ノイズ除去の強さを調整
  • 複数のノイズ除去方法を選択

 Lama cleanerを使うことで:

  • 生成画像の質を向上させる
  • よりリアルな画像に仕上げる
  • 印刷や商用利用に適した画像を作成する

③ Canvas Zoom: 画像を拡大・縮小して細かい部分まで編集

 

 Canvas Zoomは、生成画像を拡大・縮小できる拡張機能です。

 画像の一部を拡大して細かい部分まで編集したり、ブラシのサイズを調整したりすることができます。

 Control Netと組み合わせることで、より精度の高い編集が可能になります。

 

 Canvas Zoomの主な機能:

  • 画像を自由に拡大・縮小
  • ブラシのサイズを調整
  • 複数のズームレベルを記憶
  • 全画面表示

 Canvas Zoomを使うことで:

  • 人物の目や髪の毛などの細かい部分まで編集
  • 複雑な模様やテクスチャを作成
  • 画像の一部を強調して印象的な作品に仕上げる
7. 【無限の可能性を秘めた技術!】生成AIの活用事例

生成AIは、様々な分野で活用されています。

・アート作品制作: 独創的なアート作品作り
・画像素材作成: 商用利用可能な画像素材作成
・製品デザイン: 新しい製品デザインのアイデア出し
・教育: わかりやすい教材作成
・エンターテイメント: ゲームやバーチャルリアリティコンテンツ制作

8. 【未来を切り拓くAI!】これからの社会にとっての生成AI

生成AIは、私たちの生活を大きく変革する可能性を秘めた技術です。
今後も技術の発展とともに、様々な分野で活用されていくことが期待されます。

まとめ

Ubuntuで生成AIを活用することで、誰でも簡単に画像や文章、音楽などを生成することができます。クリエイティブな可能性を広げ、新たなアイデアを生み出すために、ぜひ生成AIを遊び尽くしてみてください。