AWS と NVIDIA、生成 AI 向けの新しいスーパーコンピューティング、インフラストラクチャ、ソフトウェアおよびサービスの提供での戦略的提携を発表

AWS が、NVIDIA Grace Hopper Superchip と AWS UltraCluster による拡張性を備えた、初のクラウド AI スーパーコンピューターを提供
NVIDIA GH200 NVL32 を初めて搭載した NVIDIA DGX Cloud が、AWS で利用可能に
NVIDIA の AI の研究開発とカスタムモデル開発のために、両社が Project Ceiba で提携し、GPU を活用した世界最速の AI スーパーコンピューターと最新の NVIDIA DGX Cloud スーパーコンピューターを構築
NVIDIA GH200、H200、L40S および L4 GPU を活用した、新しい Amazon EC2 インスタンスにより、生成 AI、HPC、デザインおよびシミュレーションのワークロードを加速
AWS に NVIDIA のソフトウェアが実装され、NeMo LLM フレームワーク、NeMo Retriever および BioNeMo が、カスタムモデル、セマンティック検索および創薬の発展を促進

2023 年 11 月 28 日、ラスベガス — AWS re:Invent において、Amazon.com, Inc. (NASDAQ: AMZN) の傘下企業である Amazon Web Services, Inc. とNVIDIA (NASDAQ: NVDA) は、両社の戦略的提携をさらに拡大し、顧客が生成 AI のイノベーションを促進するための、最新のインフラストラクチャ、ソフトウェアおよびサービスを提供すると発表しました。

両社は、次世代の GPU、CPU および AI ソフトウェアを搭載した NVIDIA の最新のマルチノードシステムから、AWS の Nitro System による最先端の仮想化とセキュリティ、Elastic Fabric Adapter (EFA) インターコネクトおよび UltraCluster のスケーラビリティに至るまで、NVIDIA と AWS の技術の粋を結集し、基盤モデルのトレーニングや生成 AI アプリケーションの構築に理想的なソリューションを提供します。

今回の提携拡大は、初期の機械学習 (ML) のパイオニアに、テクノロジでの最先端を前進させるために必要なコンピュート性能を提供することで生成 AI の時代を後押ししてきた、両社の長年の関係に基づくものです。

すべての業界で生成 AI を加速するという、今回の提携拡大には、以下のような取組みが含まれています。

AWS は、新しいマルチノードの NVLink™ テクノロジを搭載した NVIDIA® GH200 Grace Hopper Superchip をクラウドに実装する、初のクラウドプロバイダーとなります。NVIDIA GH200 NVL32 マルチノードプラットフォームでは、NVIDIA NVLink と NVSwitch™ テクノロジを備えた、32 基のGrace Hopper Superchip が 1 つのインスタンスに接続されます。このプラットフォームは、Amazon のパワフルなネットワーキング (EFA) で接続された、Amazon Elastic Compute Cloud (Amazon EC2) のインスタンスで利用できるようになり、高度な仮想化 (AWS Nitro System)、およびハイパースケールクラスタリング (Amazon EC2 UltraClusters) でサポートされ、両社共通の顧客が、数千の GH200 Superchip に拡張できるようにします。
NVIDIA と AWS は、NVIDIA の AI-training-as-a-service であるNVIDIA DGX™ Cloud が AWS でホストされるように連携します。これは GH200 NVL32 を搭載した、初の DGX Cloud となり、開発者は、単一のインスタンスで最大規模の共有メモリを持てるようになります。AWS 上の DGX Cloud は、最先端の生成 AI や 1 兆パラメータを超える大規模言語モデルのトレーニングを加速します。
NVIDIA と AWS は、GPU を搭載した世界最速の AI スーパーコンピューターを構築する Project Ceiba で連携します。このスーパーコンピューターは、GH200 NVL32 と Amazon EFA インターコネクトを搭載した大規模なシステムであり、AWS がNVIDIA 自身の研究開発チームのためにホストします。この類を見ない、初のスーパーコンピューターには、16,384 基の NVIDIA GH200 Superchip が搭載され、65 エクサフロップスの AI 処理が可能で、NVIDIA が生成 AI イノベーションの新たな波を生み出すために使用します。
AWS は、3 つの新しい Amazon EC2 インスタンスを導入します。5e インスタンスは、NVIDIA H200 Tensor コア GPU を搭載し、大規模かつ最先端の生成 AI と HPC のワークロードに対応します。G6 と G6e のインスタンスはNVIDIA L4 GPU およびNVIDIA L40S GPU を搭載し、それぞれが、AI のファインチューニング、推論、グラフィックスとビデオのワークロードといった、幅広いアプリケーションに対応します。G6e インスタンスは、生成 AI 対応の 3D アプリケーションを接続および構築するためのプラットフォームである NVIDIA Omniverse™ を利用した、3D ワークフロー、デジタルツインなどのアプリケーションの開発に特に適しています。

AWS の CEO である Adam Selipsky 氏は、次のように話しています。「AWS と NVIDIA は、世界初の GPU クラウドインスタンスから、13 年以上にわたって提携してきました。現在、AWS は、グラフィックス、ゲーミング、ハイパフォーマンスコンピューティング、機械学習、そして現在の生成 AI を含むワークロード向けに、最も幅広い NVIDIA GPU ソリューションを提供しています。AWS を GPU を実行活用する最高の場所にするために、NVIDIA とともにイノベーションを続けており、次世代の NVIDIA Grace Hopper Superchip と、AWS のパワフルな EFA ネットワーキング、EC2 UltraCluster のハイパースケールクラスタリング、そして Nitro の高度な仮想化機能を組み合わせています」

NVIDIA の創業者/CEO であるジェンスンフアン (Jensen Huang ) は、次のように述べています。「生成 AI は、クラウドのワークロードを変容させつつあり、多様なコンテンツ生成の基盤にアクセラレーテッドコンピューティングが採用されるようになっています。費用対効果の高い、最先端の生成 AI をあらゆる顧客に提供するという共通のミッションのもと、NVIDIA と AWS は、AI インフラストラクチャ、アクセラレーションライブラリ、基盤モデルから、生成 AI サービスに至るまで、コンピューティングスタック全体で提携します」

新しい Amazon EC2 インスタンスが、NVIDIA および AWS の最先端テクノロジと融合
AWS は、マルチノードの NVLink テクノロジを搭載した NVIDIA GH200 Grace Hopper Superchip を提供する、初のクラウドプロバイダーとなります。それぞれの GH200 Superchip は、Arm ベースの Grace CPUとNVIDIA Hopper™ アーキテクチャ GPU を同じモジュール上に組み合わせたものです。GH200 NVL32 搭載の単一 Amazon EC2 インスタンスで、最大 20 TB の共有メモリが利用できるので、テラバイト規模のワークロードへの対応が可能となります。

これらのインスタンスは、AWS の第 3 世代の Elastic Fabric Adapter (EFA) インターコネクトを活用し、Superchip あたり最大 400 Gbps の低レイテンシで、高帯域のネットワーキングスループットを実現し、顧客は EC2 UltraClusters で数千の GH200 Superchip まで拡張可能です。

GH200 NVL32 搭載の AWS のインスタンスにより、顧客は、スーパーコンピュータークラスの性能にオンデマンドアクセスでき、これは、基盤モデル、レコメンダシステムおよびベクトルデータベースなどの、複雑な AI ワークロードを複数のノードにわたって分散させる必要のある、大規模な AI/ML ワークロードにとって極めて重要となります。

NVIDIA GH200 を搭載した EC2 インスタンスは、H100 を搭載した現世代の EC2 P5d インスタンスの 7.2 倍となる、4.5 TB の HBM3e メモリを備えます。これにより、トレーニングの性能を高めながら、より大規模なモデルを実行することができます。さらに、CPU から GPU へのメモリインターコネクトは PCIe の 7 倍の帯域幅を提供し、アプリケーションが利用可能な総メモリを拡大するチップ間通信を可能にします。

GH200 NVL32 を搭載した AWS インスタンスは、水冷システムを備えた、AWS 初の AI インフラストラクチャとなります。これにより、密度の高いサーバーラックを最大限の性能で、効率的に運用できるようになります。

GH200 NVL32 搭載の EC2 インスタンスは、次世代の EC2 インスタンスを支えるプラットフォームである、AWS Nitro System も活用します。Nitro System は、機能の I/O をホスト CPU/GPU から専用ハードウェアにオフロードすることで、より安定したパフォーマンスを実現し、セキュリティの向上によって処理中の顧客のコードとデータを保護します。

AWS が Grace Hopper 搭載の NVIDIA DGX Cloud を初めてホスト
AWS は NVIDIA と協力して、GH200 NVL32 NVLink インフラストラクチャを搭載した NVIDIA DGX Cloud をホストします。NVIDIA DGX Cloud は、は極めて複雑な LLM および生成 AI モデルのトレーニングするためのマルチノードのスーパーコンピューティングに、企業が迅速にアクセスできるようにするための AI スーパーコンピューティングサービスであり、NVIDIA AI Enterprise ソフトウェアの利用と NVIDIA の AI エキスパートへの直接アクセスが可能です。

画期的な Project Ceiba スーパーコンピューターで、NVIDIA の AI 開発を加速
AWS と NVIDIA が構築している Project Ceiba スーパーコンピューターには、暗号化ネットワーキングのVirtual Private Cloud (VPC) やハイパフォーマンスブロックストレージの Amazon Elastic Block Store といった AWS のサービスが統合されており、NVIDIA は AWS の包括的な機能を利用できるようになります。

NVIDIA は、研究開発にこのスーパーコンピューターを使い、LLM、グラフィックスとシミュレーション、デジタル生物学、ロボティクス、自動運転車、Earth-2 による気候変動予測などの分野で AI を発展させます。

NVIDIA と AWS が、生成 AI、HPC およびシミュレーションを加速
最大規模の LLM の開発、トレーニングおよび推論を促進するために、AWS P5e インスタンスは、NVIDIA の最新の H200 GPU を搭載します。H200 は 141 GB の HBM3e GPU メモリを提供し、これは H100 GPU と比べて 1.8 倍の容量を持ち、1.4 倍高速です。この GPU メモリの強化と、AWS Nitro System によって実現される最大 3,200 Gbps の EFA ネットワーキングにより、顧客は AWS上で最先端モデルの構築、トレーニングおよび展開を継続することができます。

費用対効果が高く、エネルギー効率に優れた、ビデオ、AI およびグラフィックス向けのソリューションを提供するために、AWS は、NVIDIA L40S GPU と L4 GPU を搭載した新しい Amazon EC2 G6e インスタンスと、L4 GPU を搭載した G6 インスタンスを発表しました。この新しい製品は、スタートアップ、企業および研究者が、AI や高忠実度のグラフィックスのニーズを満たすのに役立ちます。

G6e インスタンスは、生成 AI やデジタルツインアプリケーションといった複雑なワークロードを処理するために構築されています。NVIDIA Omniverse を使うことにより、フォトリアリスティックな 3D シミュレーションを開発し、AWS IoT TwinMaker、インテリジェントなチャットボット、アシスタント、検索および要約といったサービスから得られるリアルタイムデータに基づいて、コンテキスト化および改良が可能になります。Amazon Robotics と Amazon Fulfillment Center は、NVIDIA Omniverse と AWS IoT で構築されたデジタルツインを統合し、倉庫のデザインやフローの最適化、よりインテリジェントなロボットアシスタントのトレーニング、そして顧客への配送の改善ができるようになります。

L40S GPU は、最大 1.45 ペタフロップスの FP8 処理性能を持ち、最大 209 テラフロップスのレイトレーシング性能を実現するレイトレーシングコアを備えています。G6 インスタンスに搭載されている L4 GPU は、自然言語処理、言語翻訳、AI による動画と画像の解析、音声認識、パーソナライゼーション向け AI モデルを導入するための、低コストでエネルギー効率に優れたソリューションを提供します。L40S GPU は、リアルタイムの映画品質のグラフィックスの作成とレンダリング、ゲームのストリーミングなどの、グラフィックスワークロードも加速します。これら 3 つのインスタンスはいずれも、来年に利用可能となる予定です。

AWS 上の NVIDIA ソフトウェアが生成 AI の開発を加速
さらに、NVIDIA は、AWS 上での生成 AI の開発を加速するソフトウェアを発表しました。NVIDIA NeMo™ Retriever マイクロサービスは、高速化されたセマンティック検索を使用し、正確度に優れたチャットボットや要約ツールを作成するための新たなツールです。Amazon SageMaker で現在利用可能な NVIDIA BioNeMo™ は、NVIDIA DGX Cloud 上の AWS での利用もまもなく可能になります。BioNemo を使用することで、製薬企業は自社のデータを使ったモデルのトレーニングを簡素化および加速することで、創薬をスピードアップすることができます。

AWS 上の NVIDIA ソフトウェアは、Amazon が自社のサービスとオペレーションに新たなイノベーションをもたらすのを支援しています。A WS は、NVIDIA NeMo フレームワークを使用し、次世代 Amazon Titan LLM のいくつかをトレーニングしています。Amazon Robotics は NVIDIA Omniverse Isaac の利用を開始し、倉庫を現実世界へ展開する前に、仮想空間において自律倉庫の自動化、最適化、計画のためにデジタルツインを構築しています。

NVIDIA について
1993年の創業以来、NVIDIA（https://www.nvidia.com/ja-jp/） (NASDAQ: NVDA) はアクセラレーテッドコンピューティングのパイオニアです。同社が 1999 年に発明した GPU は、PC ゲーム市場の成長を促進し、コンピューターグラフィックスを再定義して、現代の AI の時代に火をつけながら、各種産業のデジタル化を後押ししています。NVIDIA は現在、業界を再形成しているデータセンター規模の製品を提供するフルスタックコンピューティング企業です。詳細は、こちらのリンクから：https://nvidianews.nvidia.com/

Amazon Web Services について
2006 年から、Amazon Web Services は、世界で最も充実し、広く導入されているクラウドサービスとなっています。AWS は、ワークロードに仮想対応するためにサービスを継続的に拡大してきており、現在は、32 の地理的地域にある 102 のアベイラビリティゾーンで、演算、ストレージ、データベース、ネットワーキング、解析、機械学習と人工知能 (AI)、モノのインターネット (IoT)、モバイル、セキュリティ、ハイブリッド、仮想現実と拡張現実 (VR と AR)、メディア、並びにアプリケーションの開発、展開および管理のために 240 を超える本格的サービスを提供しており、カナダ、ドイツ、マレーシア、ニュージーランドおよびタイでアベイラビリティゾーンを 15 増やし、AWS リージョンを 5 つ増やす計画を発表しています。高い成長力を誇るスタートアップ、大規模なエンタープライズおよび先進的な政府機関を含む、数百万のお客様が、AWS を信頼してインフラストラクチャに活用することで、よりアジャイルになり、費用を削減しています。AWS についての詳しい情報は、aws.amazon.com をご覧ください。

本プレスリリースに含まれる特定の記述には、以下のような記述が含まれますが、これらに限定されるものではありません：NVIDIA GH200 Grace Hopper Superchip、NVL32、H200、NeMo Retriever、NVLink、NVSwitch、NVIDIA DGX Cloud、NVIDIA L40S、NVIDIA Omniverse、NVIDIA L4、NVIDIA NeMo、NVIDIA BioNeMo および NVIDIA AI Enterprise を含む、NVIDIA の製品およびテクノロジの便益、影響、性能、機能および提供時期、Project Ceiba を含む、AWS と NVIDIA の提携拡大の便益と影響、およびそのサービスと機能の提供時期、ならびに生成 AI がクラウドのワークロードを変容させつつあり、多様なコンテンツ生成の基盤にアクセラレーテッドコンピューティングが採用されるようになっていることなど、本プレスリリースにおける一定の記載は、将来予測的なものが含まれており、予測とは著しく異なる結果を生ずる可能性があるリスクと不確実性を伴っています。かかるリスクと不確実性は、世界的な経済環境、サードパーティに依存する製品の製造、組立、梱包、試験、技術開発および競合による影響、新しい製品やテクノロジの開発あるいは既存の製品やテクノロジの改良、NVIDIA 製品や協業企業の製品の市場への浸透、デザイン、製造あるいはソフトウェアの欠陥、ユーザーの嗜好および需要の変化、業界標準やインターフェイスの変更、システム統合時に NVIDIA 製品および技術の予期せぬパフォーマンスにより生じる損失などを含み、その他のリスクの詳細に関しては、Form 10-K での NVIDIA のアニュアルレポートならびに Form 10-Q での四半期レポートなど、米証券取引委員会 (SEC) に提出されている NVIDIA の報告書に適宜記載されます。SEC への提出書類は写しが NVIDIA の Web サイトに掲載されており、NVIDIA から無償で入手することができます。これらの将来予測的な記述は発表日時点の見解に基づくものであって将来的な業績を保証するものではなく、法律による定めがある場合を除き、今後発生する事態や環境の変化に応じてこれらの記述を更新する義務を NVIDIA は一切負いません。

© 2023 NVIDIA Corporation.無断複写・転載を禁じます。NVIDIA、NVIDIAロゴ、NVIDIA NeMo、NVIDIA Triton Inference Server、NVIDIA TensorRT およびNVIDIA Grace Hopper は、米国およびその他の国におけるNVIDIA Corporationの商標および/または登録商標です。その他の会社名および製品名は、関連する各社の商標である場合があります。機能、価格、可用性および仕様は予告なく変更されることがあります。