概要:
この文書は、NVIDIA CEO ジェンスン・ファン氏による GTC 2025 基調講演の抜粋をレビューし、主要なテーマ、重要なアイデア、事実をまとめたものです。講演では、AIの進化、NVIDIAの最新技術とロードマップ、そしてクラウド、エンタープライズ、ロボティクスといった各分野におけるAIの応用と将来展望が強調されました。特に、推論(Inference)の重要性と、それを実現するための新しいコンピューティングアーキテクチャ「Blackwell」の詳細、そしてAIファクトリーという新しいコンセプトが重要な焦点となっています。
主要テーマと重要なアイデア:
- AIの新たなフロンティア:トークンとジェネレーティブAIからエージェントAI、そしてフィジカルAIへ:
- ファン氏は、AIの進化を「トークン」という概念から説明し始め、それらが「知能が作られる新しい種類の工場」、「AIの構成要素」であると述べました。
- トークンは、「画像を科学データに変え、異星の大気を図表化し、未来の探検家を導く」、「生データを予見に変える」、「物理法則を解読して、より速く、より遠くへ到達させる」、「病気が蔓延する前にそれを見抜く」、「生命の言語を解き明かし、私たちを突き動かすものを学ぶ」、「潜在力を豊穣に変える」といった多様な可能性を秘めていると強調されました。
- 過去5年間は主にジェネレーティブAI(テキストから画像、画像からテキストなど、異なるモダリティ間の変換)に焦点が当てられていましたが、現在はより高度な「エージェントAI(Agentic AI)」へと進化していると述べられました。
- エージェントAIは、「状況の文脈を認識し理解する」、「推論する」、「問題を解決する方法を計画し、実行する」、「ツールを使用する」能力を持つとされています。ファン氏は、「エージェントAIの基礎には、もちろん非常に新しい推論があり、そして次の波はすでに起こっています。今日、それについて多くを語ります。物理AIによって可能になったロボティクス、物理世界を理解するAIです」と述べ、ロボティクスにおけるフィジカルAIの重要性を示唆しました。
- 各AIの段階(知覚AI、ジェネレーティブAI、エージェントAI、フィジカルAI)は新たな市場機会を生み出し、GTCへの新たなパートナーの参加を促進していると述べられました。
- AIの進化を支える3つの問題:
- ファン氏は、AIの各段階を可能にする核となる3つの問題を指摘しました。
- データ問題: AIはデータ駆動型のアプローチであり、学習のためのデータ、デジタル経験が必要である。「どのようにデータ問題を解決するか?」が最初の課題です。
- トレーニング問題: 人間の介入なしにAIをトレーニングする方法。「人間をループから外すことが に難しいのは、私たちの時間には限りがあり、AIには超人的な速度で、人間が追いつけない規模で学習してもらいたいからです」と述べ、自動的なトレーニングの必要性を強調しました。
- スケーリング問題: より多くのリソースを提供することで、AIがより賢くなるようなアルゴリズムを見つけること。「この昨年、ほぼ全世界が間違っていました。AIの計算要件、スケーリング則は、より回復力があり、実際には超加速しています。この1年間で、エージェントAIの結果として、推論の結果として、私たちが必要だと考えていた計算量は、容易に100倍以上になっています」と述べ、AIの高度化に伴う計算量の爆発的な増加を指摘しました。
- 推論における計算量の爆発的増加とBlackwellアーキテクチャの革新:
- ファン氏は、エージェントAIの核となる「推論」プロセスが、従来のAIと比較して桁違いのトークン生成と計算量を必要とすることを説明しました。
- 推論では、AIが段階的に問題を解決したり、複数の解決策を検討したり、自身の答えを検証したりするため、生成されるトークン数が大幅に増加します。
- 「2年前、ChatGPTに取り組み始めた頃、奇跡的ではありましたが、多くの複雑な質問や単純な質問に簡単に答えることができませんでした。それは当然のことです。事前学習データから学んだこと、事前学習データから見た他の経験に基づいて、一発で答えを吐き出していました。(中略)今では、AIがステップバイステップで推論できるのです」と述べ、推論能力の進化を強調しました。
- 推論モデルのトレーニングには、「数百もの異なるトピック、数百万もの異なる例、数百もの異なる試行」が必要であり、「数兆ものトークン」が生成されると述べました。
- このような計算需要に対応するため、NVIDIAは新しい「Blackwell」アーキテクチャを開発しました。
- ファン氏は、GeForceの進化(5090が4090と比較して小型化、エネルギー効率向上、性能向上)を引き合いに出し、AIがコンピュータグラフィックスを革新したように、BlackwellがAIコンピューティングを大きく変えるだろうと述べました。
- 特に、「スケールアップ」の重要性を強調し、従来のHGXシステムから、MVLinkスイッチをdisaggregate(分離)し、液冷を採用した新しいラックスケールのアーキテクチャを紹介しました。「これは、世界のコンピューターアーキテクチャにおける фундаментальные な移行です」と述べ、その革新性を強調しました。
- 1ラックに1エクサフロップスのコンピューティング能力を持つシステムを実現したことを発表し、これは「究極のスケールアップ」であるとしました。
- AIファクトリーとNVIDIA Dynamo:
- ファン氏は、AIインフラストラクチャを「AIファクトリー」という新しいコンセプトで捉え、その役割は「信じられないほどのトークンを生成すること」であると述べました。
- AIファクトリーは、音楽、言葉、ビデオ、研究、化学物質、タンパク質など、様々な種類の情報に再構成されるトークンを生成する専用のインフラストラクチャです。
- AIファクトリーの運用を最適化するための新しいソフトウェア「NVIDIA Dynamo」を発表しました。
- Dynamoは、AIファクトリーの「オペレーティングシステム」として機能し、分散されたGPUリソースの管理、ワークロードの最適化、低遅延と高スループットのバランス調整などを自動的に行うと説明されました。
- 「Dynamoは、パイプライン並列、テンソル並列、エキスパート並列、(中略)インフライトバッチ処理、分離された推論、ワークロード管理をすべて行います」と述べ、その複雑な機能を強調しました。
- Dynamoはオープンソースであり、多くのパートナー企業と協力して開発が進められていることが紹介されました(例:Perplexity)。
- 推論性能の飛躍的な向上:
- ファン氏は、BlackwellとDynamoの組み合わせにより、推論性能が大幅に向上することをデモンストレーションと数値データで示しました。
- 推論における「思考トークン」の重要性を説明し、複雑な問題解決にはより多くのトークンと計算が必要であることを示しました(結婚式の席次決定の例)。
- Hopperアーキテクチャと比較して、Blackwellアーキテクチャ(MVLink 72、FP4精度、Dynamo適用)は、ISOパワー(同一電力消費)条件下で最大25倍の推論性能を発揮すると強調しました。
- 特に、推論モデルのタイプ(例:推論モデル)によっては、BlackwellがHopperの40倍の性能を示すケースもあるとしました。
- 100メガワットのAIファクトリーにおけるGPU数やラック数の比較を示し、Blackwellベースのファクトリーがより少ないリソースでより高いトークン生成能力を持つことを示唆しました。
- AIファクトリーのデジタルツイン:
- 大規模なAIファクトリーの構築と運用は非常に複雑であるため、NVIDIAは「AI Factoryデジタルツイン」というコンセプトを提唱しました。
- Omniverse Blueprintを活用することで、物理的な建設を開始する前に、AIファクトリーの設計、最適化、シミュレーションが可能になると説明されました。
- 電力供給、冷却システム、ネットワークトポロジーなどを仮想環境で詳細に検討し、TCO(総所有コスト)の削減と電力効率の最大化を図ることができると述べられました。
- NVIDIAの明確なロードマップ:
- ファン氏は、今後のNVIDIAの製品ロードマップを詳細に示しました。
- Blackwell: 現在フル生産中。
- Blackwell Ultra (今年後半): Blackwellの強化版、性能、メモリ、帯域幅が向上。
- Vera Rubin (来年後半): 新しいCPU、GPU(CX9)、ネットワーキング(MVLink 144)、メモリ(HBM4)など、ほぼすべてのコンポーネントが刷新。ダークマターを発見した天文学者ヴェラ・ルービンにちなんで命名。
- Rubin Ultra (2027年後半): Vera Rubinのさらに強化版、MVLink 576による究極のスケールアップ、ラックあたり600kW、15エクサフロップスの性能。
- ロードマップを事前に開示することで、顧客が長期的なAIインフラストラクチャの計画を立てやすくすることを意図していると説明されました。
- スケールアップにおける性能向上率(Hopper比)を示し、Rubinが900倍のスケールアップFLOPSを持つと予測されました。
- スケールアウト技術:Infiniband、Spectrum X、そしてシリコンフォトニクス:
- スケールアップに加えて、多数のGPUを接続するためのスケールアウトネットワーク技術の重要性も強調されました。
- InfinibandとSpectrum X(イーサネットベース)が、高性能なAIクラウドやエンタープライズAIの基盤となることを説明しました。
- 特に、数百万のGPUへのスケールアップを実現するためのキーテクノロジーとして、NVIDIA初のコパッケージオプションであるシリコンフォトニクスシステム(1.6テラビット/秒 CPO、マイクロリング共振器変調器ベース)を発表しました。
- 従来のトランシーバーと比較して、大幅な電力効率向上と高密度化が可能になり、大規模AIデータセンターの電力制約を克服する上で不可欠な技術であると強調されました。
- エンタープライズAIの変革:
- AIを世界中のエンタープライズに普及させるためのNVIDIAの取り組みが紹介されました。
- 従来のデータアクセス方法から、AIエージェントによる意味ベースのアクセスへと移行する将来像が示されました。
- 新しいエンタープライズコンピューティングラインナップ「DGX Spark」(Mediatekと共同開発のCPU搭載、コンパクト)と「DGX Station」(Grace Blackwell液冷、20ペタフロップス)を発表し、AI開発者やデータサイエンティスト向けの新しいパーソナルコンピューティングの形を提示しました。
- ストレージシステムの再構築にも言及し、GPUアクセラレーションによる意味ベースのストレージシステムが将来のエンタープライズストレージの姿になるとしました。
- Dellとの連携によるエンタープライズAIインフラストラクチャの包括的な提供が発表されました。
- エンタープライズ向けのオープンソース推論モデル「NVIDIA NIMs」を発表し、オンプレミス、クラウド、あらゆる環境で利用可能であることを強調しました。Accenture、AMDOCS、AT&T、BlackRock、Cadence、Capital One、Deloitte、NASDAQ、SAP、ServiceNowなど、多くのパートナー企業がNVIDIAのAI技術を活用していることが紹介されました。
- ロボティクスの未来:フィジカルAIとNVIDIA Isaac Groot:
- ロボティクス分野におけるAIの可能性が強調され、労働力不足の解決策としてのロボットの重要性が示唆されました。
- ロボットAIの開発における課題(データ問題、モデルアーキテクチャ、スケーリング)と、NVIDIAの取り組み(Omniverse、Cosmosによる合成データ生成、Isaac Labによるトレーニング、Megaによるフリートシミュレーション)が説明されました。
- 人型ロボットの汎用基盤モデル「NVIDIA Isaac Groot N1」を発表しました。
- Groot N1は、高速思考システムと低速思考システムのデュアルアーキテクチャを持ち、環境認識、推論、計画、そして精密な動作制御を可能にすると説明されました。
- 合成データ生成とシミュレーションによる学習を基盤としており、多様なロボットの形態やタスクに適応できる汎化能力を持つとされました。
- 物理シミュレーションエンジン「Newton」(DeepMind、Disney Researchとの共同開発、GPUアクセラレーション、高精度な剛体・軟体シミュレーション、触覚フィードバック対応)を発表し、ロボットAIのトレーニングにおけるリアリズムと効率性を大幅に向上させるとしました。
- Groot N1のオープンソース化を発表し、ロボティクス研究開発の加速への期待を示しました。
結論:
ジェンスン・ファン氏の基調講演は、NVIDIAがAIのあらゆる領域で技術革新を推進し、そのエコシステムを拡大し続けていることを明確に示しました。特に、推論ワークロードの重要性の高まりと、それを解決するためのBlackwellアーキテクチャ、そしてAIファクトリーという新しいコンピューティングパラダイムの提案は、今後のAIインフラストラクチャの方向性を示すものと言えるでしょう。また、エンタープライズAIとロボティクス分野への積極的な展開も、NVIDIAのAI戦略の重要な柱であることが改めて示されました。
特筆すべき引用:
- 「これは、知能が作られる新しい種類の工場、AIの構成要素であるトークンが、新たなフロンティアを開いたのです。」
- 「エージェントAIの基礎には、もちろん非常に新しい推論があり、そして次の波はすでに起こっています。今日、それについて多くを語ります。物理AIによって可能になったロボティクス、物理世界を理解するAIです。」
- 「この昨年、ほぼ全世界が間違っていました。AIの計算要件、スケーリング則は、より回復力があり、実際には超加速しています。」
- 「これは、世界のコンピューターアーキテクチャにおける фундаментальные な移行です。」(ラックスケールBlackwellについて)
- 「AIファクトリーには1つの仕事しかありません。それは、信じられないほどのトークンを生成することです。」
- 「Dynamoは、AIファクトリーのオペレーティングシステムです。」
- 「Blackwellは、ISOパワーでHopperの25倍です。」
- 「AIインフラストラクチャを3つ構築しています。クラウド向けAIインフラストラクチャ、エンタープライズ向けAIインフラストラクチャ、そしてロボット向けAIインフラストラクチャです。」
- 「フィジカルAIは、あらゆる種類の、あらゆる産業のロボットに宿ります。」
今後の展望:
NVIDIAのロードマップと技術革新は、AI分野全体の進歩を加速させるでしょう。特に、Blackwellアーキテクチャと関連技術の普及、エンタープライズAIの浸透、そしてロボティクス分野におけるブレークスルーが期待されます。GTC 2025は、これらのトレンドを把握し、今後のAIの可能性を探る上で非常に重要なイベントと言えるでしょう。