AWSで生成AIアプリを構築、まずは関連するサービススタックを把握しよう
針原 佳貴
アマゾン ウェブ サービス ジャパン
尾原 颯
IVRy
吉田 真吾
ジェネラティブエージェンツ
AWSで生成AIアプリを構築、まずは関連するサービススタックを把握しよう | 日経クロステック(xTECH)
クラウドサービス「Amazon Web Services(AWS)」では生成AI(人工知能)に関連した様々なサービスが提供されている。書籍『AWS生成AIアプリ構築実践ガイド』からの転載で、AWSでの生成AIアプリ開発について解説する。
AWSが提供する生成AIサービスを3つの層に分けて説明したのが以下の図です。下から順に、具体的なサービスを紹介しながら説明します。
図1 AWSのAIサービススタック
[画像のクリックで拡大表示]
AIモデルの学習・推論のためのインフラストラクチャ
Amazon SageMaker AIは、モデル構築、学習、デプロイ、MLOps、ガバナンスまでの包括的なAI/MLライフサイクルを管理するマネージドサービスとして進化しています。機械学習モデルの開発から本番運用まで、エンドツーエンドのワークフローをサポートします。Amazon EC2やAmazon SageMaker HyperPodなどAIコンピュートサービスでは、AWSがAIの学習・推論用に独自設計したAWS Trainium、Inferentiaチップや最新のNVIDIA GPUを搭載したインスタンスにより、FM/LLMの学習と推論を効率的に行えます。Amazon EC2 UltraClustersによる高性能な大規模クラスタを、Elastic Fabric Adapter(EFA)による高速ネットワーキングを活用してスケーラブルに構築可能です。さらに、PyTorchなどの主要AIフレームワークや、Trainium/Inferentia向けのAWS NeuronというSDKを通じて、ハードウェアリソースを最大限に活用できるソフトウェアスタックも提供しています。
AIおよびエージェント開発のためのソフトウェア・ツール
大きく3つの構成要素があります。
1つめのNova Actは、Webブラウザ内でアクションを実行するように学習されたAIモデルです。Nova Act SDKは、Nova Actモデルを搭載した信頼性の高いブラウザエージェントを可能にするために特別に構築されていて、スケーラブルなクラウドベースのブラウザ実行のために、AgentCore Browserを使用します。顧客はこのSDKを使用して独自のブラウザ自動化エージェントを構築できます。
2つめのStrands Agentsは、オープンソースのSDKとして、柔軟なオーケストレーションパターンを提供します。Model Control Protocol(MCP)とAgent2Agent(A2A)のサポートにより、異なる環境間での複数のエージェントとツール間のシームレスな協調を可能にします。AWS API MCP Serverも提供され、AWSサービスを呼び出せるインターフェースをエージェントに提供します。
3つめのAmazon Bedrockは、Amazon Novaシリーズを含む複数の基盤モデルへのアクセスを提供します。Amazon Nova customizationがSageMaker AIで利用可能となり、事前学習から事後学習まで、包括的なモデルカスタマイゼーション機能を提供しています。
図2 Amazon Bedrockの構成要素
[画像のクリックで拡大表示]
Bedrockには、モデルのカスタマイズのほか、責任あるAIを実現するためのAmazon Bedrock Guardrails、モデル評価のための機能や、RAG構築のためのAmazon Bedrock Knowledge Basesなど、生成AIアプリ構築に必要な様々な機能が統合されています。
Bedrock AgentCoreは、エンタープライズ規模でエージェントを展開・運用するための完全なサービスセットです。7つの主要コンポーネントとして、AgentCore Runtime(セッション分離による安全なサーバーレスランタイムで、チェックポイントと復旧機能を備える)、AgentCore Memory(短期記憶と長期記憶の両方をサポート)、AgentCore Identity(一時的で詳細な権限による安全なアクセス管理)、AgentCore Gateway(APIやサービスをエージェント対応ツールに変換)、AgentCore Code Interpreter(安全なコード実行環境)、AgentCore Browser(Webインタラクション機能)、AgentCore Observability(リアルタイムの可視性とテレメトリ)が提供されています。これらの機能は、CrewAI、LangGraph、LlamaIndex、Strands Agentsなどの人気のオープンソースフレームワークと連携し、開発者がビジネス価値の創出に集中できるようにします
生成AIアプリケーション
Kiroは、開発者がコンセプト作りから本番環境の構築まで「仕様駆動開発」で進められるAIIDEです。自然言語で記述したプロンプトを詳細な仕様に変換し、さらに動作するコード、ドキュメント、テストに変換することで、開発者が望む通りのものを正確に構築できます。Kiroのエージェントは、困難な問題の解決や、ドキュメント生成・ユニットテストなどのタスクを自動化し、開発者がプロトタイプを超えてチームと共有可能な製品を構築することを支援します。
Amazon Qは、企業内データを活用した生成AIアシスタントとして進化しています。Amazon Q Businessは企業内データを使用して回答できる生成AIアシスタントであり、Amazon Q Developerはアプリケーションのコーディング、テスト、デプロイなど、ソフトウェア開発ライフサイクル全体を支援します。
AWS Transformは、コード分析、リファクタリング、依存関係マッピングなどの複雑なモダナイゼーションタスクを自動化する専門AIエージェントを展開します。エンタープライズのワークロードを移行するプロジェクトのタイムラインを大幅に短縮し、レガシーシステムの現代化を加速します。
Amazon Connectは、包括的な顧客体験ソリューションとして、すべてのチャネルにわたる顧客インタラクションで組織が無制限のAIを提供できるよう支援します。顧客との接点すべてにAIを統合し、カスタマーエクスペリエンスを変革します。
AWS Marketplaceでは、AWSパートナーが提供する事前構築済みのAIエージェントやツールを購入できます。APIベースの展開方法により、MCPとA2Aをサポートする他のエージェントやツールとの統合も簡素化されており、信頼できるAWSサービスまたはAWS環境で実行しながら、セキュリティとアクセスの制御を維持できます
針原 佳貴(はりばら よしたか)
アマゾン ウェブ サービス ジャパン
シニア生成 AI・量子スタートアップソリューションアーキテクト。AWSでユニコーン企業を含む生成AIスタートアップ企業を中心に技術支援を担当。日本発の基盤モデルのクラウド公開も推進している。
尾原 颯(おはら そう)
IVRy
AIエンジニア/Japan Healthcare Innovation Hub Community Manager。前職のAWSでは、AWSを活用する機械学習系やヘルスケアのスタートアップを中心に技術支援を担当。登壇などを通じてAWSの生成AI活用も促進。
吉田 真吾(よしだ しんご)
ジェネラティブエージェンツ
ジェネラティブエージェンツ取締役COO/セクションナイン代表取締役。ChatGPT Community(JP)、LangChain Community(JP)、Serverless Community(JP)などを主催。日本でのAIエージェントやサーバーレスの普及を促進
AWSで生成AIアプリを構築、まずは関連するサービススタックを把握しよう(2ページ目) | 日経クロステック(xTECH)