VMware と NVIDIA、企業向け生成 AI で協業

新しい VMware Private AI Foundation with NVIDIA により、企業は生成 AI の利用が可能に。データのプライバシー、セキュリティ、管理をさらにサポートするプラットフォームを提供

ラスベガス - VMware Explore - 2023年8月22日- VMware (NYSE: VMW) と NVIDIA (NASDAQ: NVDA) は本日、VMware のクラウド インフラストラクチャ上で稼働する数十万の企業を生成 AI の時代に対応させるための戦略的パートナーシップの拡大を発表しました。

VMware Private AI Foundation with NVIDIA により、企業はモデルをカスタマイズし、インテリジェントなチャットボット、アシスタント、検索、要約などの生成 AI アプリケーションを実行できるようになります。このプラットフォームは、VMware Cloud Foundation 上に構築され、AI 向けに最適化された NVIDIA の生成 AI ソフトウェアとアクセラレーテッド コンピューティングが提供される完全な統合ソリューションです。

VMware の CEO である Raghu Raghuram 氏は、次のように述べています。「生成 AI とマルチ クラウドは完璧な組み合わせです。顧客のデータは、データセンター、エッジ、クラウドなど、あらゆる場所に存在します。NVIDIA と協力することで、企業のデータ プライバシー、セキュリティ、管理に関する懸念に対処しながら、企業が安心してデータに隣接した生成 AIのワークロードを実行できるようになります」

NVIDIA の創業者/CEO であるジェンスン フアン (Jensen Huang) は、次のように述べています。「あらゆる企業が、生成 AI のビジネスへの統合を急いでいます。VMware との協業の拡大は、金融サービス、ヘルスケア、製造業など、さまざまな分野の何十万ものお客様に、独自のデータで構築されたカスタム アプリケーションを使用して、生成 AI の可能性を引き出すために必要なフルスタックのソフトウェアとコンピューティングを提供します」

生成 AI を強化するフルスタック コンピューティング
ビジネス上の利益をより早く達成するため、企業は生成 AI アプリケーションの開発、テスト、展開を効率化しようとしています。McKinsey は、生成 AI が世界経済に年間最大 4 兆 4,000 億ドルの利益をもたらすと予測しています。(1)

VMware Private AI Foundation with NVIDIA により、企業はこの機能を活用して、大規模言語モデルをカスタマイズし、よりセキュアでプライベートなモデルを社内向けに作成し、生成 AI をサービスとしてユーザーに提供し、大規模に推論ワークロードをより安全に実行できるようになります。

このプラットフォームには、企業がコスト効率の高い方法で、自社のプライベートなデータでトレーニングさせた実証済みのモデルを実行できるようにする統合 AI ツールが含まれる予定です。VMware Cloud Foundation と NVIDIA AI Enterprise ソフトウェア上に構築されるこのプラットフォームには、以下のようなメリットが含まれます。

  • プライバシー:データのプライバシーを保護し、安全なアクセスを可能にするアーキテクチャにより、データのある場所に隣接して AI サービスを簡単に実行することが可能。
  • 選択肢:企業は、NVIDIA NeMo™ から Llama 2、そしてその先のモデルを構築し実行する場所において、主要な OEM ハードウェア構成や、将来的にはパブリック クラウドやサービス プロバイダーの提供するものを含め、幅広い選択肢を持つことが可能。
  • パフォーマンス:NVIDIA アクセラレーテッド インフラストラクチャ上での実行は、最近の業界ベンチマークで証明されているように、いくつかの使用例においてベアメタルと同等、あるいはそれを上回るパフォーマンスを提供。
  • データセンター規模:仮想環境における GPU スケーリングの最適化により、AI ワークロードを単一の仮想マシン内の最大 16 基の vGPU/GPU や複数のノードにまたがって拡張できるようになり、生成 AI モデルのファインチューニングと展開が高速化。
  • コスト削減:GPU、DPU、CPU など、すべての演算リソースを最大限に活用することで、全体的なコストを削減し、チーム間で効率的に共有できるリソース環境を構築。
  • ストレージの高速化:VMware vSAN Express Storage Architecture は、パフォーマンスに最適化された NVMe ストレージを提供し、RDMA による GPUDirect® ストレージをサポートすることで、CPU を介さずにストレージから GPU に直接 I/O 転送が可能。
  • ネットワークの高速化:vSphere と NVIDIA NVSwitch™ テクノロジとの高度な統合により、マルチ GPU モデルを GPU 間のボトルネックなしに実行可能。
  • 迅速な展開と価値実現までの時間 (Time to Value):vSphere Deep Learning VM イメージとイメージ リポジトリは、フレームワークとパフォーマンスに最適化されたライブラリがプリインストールされた安定したターンキー ソリューション イメージを提供し、迅速なプロトタイピング機能を実現。

このプラットフォームは、NVIDIA AI プラットフォームのオペレーティング システムである NVIDIA AI Enterprise に含まれるエンドツーエンドのクラウド ネイティブなフレームワークである NVIDIA NeMo を備えており、企業は事実上どこでも生成 AI モデルを構築、カスタマイズ、展開することができます。NeMo は、カスタマイズ フレームワーク、ガードレール ツールキット、データ キュレーション ツール、および事前トレーニング済みモデルを組み合わせて、企業が生成 AI を導入するための簡単で費用対効果の高い迅速な方法を提供します。

NeMo は、生成 AI を本稼働向けに展開するために、TensorRT for Large Language Models (TRT-LLM) を使用しています。TRT-LLM は、NVIDIA GPU 上で最新の LLM の推論パフォーマンスを高速化し、最適化します。NeMo により、VMware Private AI Foundation with NVIDIA は、企業が VMware のハイブリッド クラウド インフラストラクチャ上で独自のデータを取り込み、カスタム生成 AI モデルを構築、実行できるようにします。

VMware Explore 2023 で、NVIDIA と VMware は、企業内の開発者が新しい NVIDIA AI Workbench を使用して、Hugging Face で利用可能な Llama 2 のようなコミュニティ モデルを取り込み、それらをリモートでカスタマイズし、VMware 環境に本稼働可能な生成 AI を展開する方法を紹介します。

VMware Private AI Foundation with NVIDIA の幅広いエコシステム サポート
VMware Private AI Foundation with NVIDIA は、NVIDIA L40S GPUNVIDIA BlueField®-3 DPU、および NVIDIA ConnectX®-7 SmartNIC により、企業の LLM のカスタマイズと推論ワークロードを強化するシステムをいち早く提供する Dell Technologies、Hewlett Packard Enterprise、および Lenovo によってサポートされます。

NVIDIA L40S GPU は、NVIDIA A100 Tensor コア GPU と比較して、最大 1.2 倍の生成 AI 推論性能と最大 1.7 倍のトレーニング性能を可能にします。

NVIDIA BlueField-3 DPU は、仮想化、ネットワーク、ストレージ、セキュリティ、その他のクラウド ネイティブな AI サービスの膨大な計算負荷を GPU や CPU から加速、オフロード、分離します。

NVIDIA ConnectX-7 SmartNIC は、世界で最も要求の厳しい AI ワークロードを加速するために、データセンター インフラストラクチャにスマートで高速なネットワークを提供します。

VMware Private AI Foundation with NVIDIA は、両社の 10 年にわたるパートナーシップを基盤としています。両社の共同エンジニアリングにより、NVIDIA AI Enterprise をベアメタルに匹敵するパフォーマンスで実行できるよう、VMware のクラウド インフラストラクチャが最適化されました。相互の顧客は、VMware Cloud Foundation によって実現されるリソースとインフラ管理と柔軟性から、さらなる恩恵を受けることができます。

提供時期
VMware は、VMware Private AI Foundation with NVIDIA を 2024 年初頭にリリースする予定です。

NVIDIA について
1993年の創業以来、NVIDIA(https://www.nvidia.com/ja-jp/) (NASDAQ: NVDA) はアクセラレーテッド コンピューティングのパイオニアです。同社が 1999 年に発明した GPU は、PC ゲーム市場の成長を促進し、コンピューター グラフィックスを再定義して、現代の AI の時代に火をつけながら、各種産業のデジタル化を後押ししています。NVIDIA は現在、業界を再形成しているデータセンター規模の製品を提供するフルスタック コンピューティング企業です。詳細は、こちらのリンクから:https://nvidianews.nvidia.com/

VMware について
VMware は、あらゆるアプリケーションに対応したマルチクラウド サービスを提供するリーディング プロバイダーであり、企業によるコントロール下でのデジタル イノベーションを実現します。

VMware のあらゆる活動の中核にあるのは、VMware に与えられた責任と機会をまっとうし、すべての人にとってより安全かつ公平で、持続可能な未来を実現することです。詳細は、こちらのリンクから:www.vmware.com/company

(1)『生成 AIの経済的可能性:次の生産性フロンティア』 McKinsey、2023年

NVIDIA AI Enterprise、NVIDIA NeMo、TensorRT、NVIDIA L40S GPU、NVIDIA BlueField-3 DPU、およびNVIDIA ConnectX-7 SmartNICを含む、NVIDIAの製品および技術の利点、影響、性能、機能、および可用性、VMware Private AI Foundation with NVIDIAプラットフォームの利点、影響、機能、および可用性を含む、NVIDIAとVMwareとのパートナーシップ、NVIDIAプラットフォームとVMware Private AI Foundationがもたらすメリットとその機能、利用可能性、生成AIのビジネスへの統合、VMwareとNVIDIAの協業拡大、金融サービス、ヘルスケア、製造業をはじめとする数十万の顧客に、独自のデータで構築されたカスタム アプリケーションを使用して生成AIの可能性を引き出すために必要なフルスタック ソフトウェアとコンピューティングを提供、生成AIは世界経済に年間最大4 兆 4,000 億ドルまた、NVIDIAとサードパーティがプラットフォームをサポートするVMware Private AI Foundationに対する広範なエコシステムのサポートなど、本プレスリリースにおける一定の記載は、将来予測的なものが含まれており、予測とは著しく異なる結果を生ずる可能性があるリスクと不確実性を伴っています。かかるリスクと不確実性は、世界的な経済環境、サードパーティに依存する製品の製造、組立、梱包、試験、技術開発および競合による影響、新しい製品やテクノロジの開発あるいは既存の製品やテクノロジの改良、NVIDIA 製品や協業企業の製品の市場への浸透、デザイン、製造あるいはソフトウェアの欠陥、ユーザーの嗜好および需要の変化、業界標準やインターフェイスの変更、システム統合時に NVIDIA 製品および技術の予期せぬパフォーマンスにより生じる損失などを含み、その他のリスクの詳細に関しては、Form 10-K での NVIDIA のアニュアル レポートならびに Form 10-Q での四半期レポートなど、米証券取引委員会 (SEC) に提出されている NVIDIA の報告書に適宜記載されます。SEC への提出書類は写しが NVIDIA の Web サイトに掲載されており、NVIDIA から無償で入手することができます。これらの将来予測的な記述は発表日時点の見解に基づくものであって将来的な業績を保証するものではなく、法律による定めがある 場合を除き、今後発生する事態や環境の変化に応じてこれらの記述を更新する義務を NVIDIA は一切負いません。

本リリースに記載されている製品や機能の多くはまだ様々な段階にあり、利用可能になった時点で提供される予定です。上記の記述は、コミットメント、約束、または法的義務として意図されたものではなく、またそう解釈されるべきでもありません。また、NVIDIA 製品についての説明に含まれる特徴や機能の開発、リリースおよび時期は変更される可能性があり、NVIDIAの単独の裁量に委ねられます。NVIDIAは、ここに記載された製品、特徴または機能の不達または遅延について、いかなる責任も負いません。

© 2023 NVIDIA Corporation.無断複写・転載を禁じます。NVIDIA、NVIDIAロゴ、BlueField、ConnectXおよびNeMoは、米国およびその他の国におけるNVIDIA Corporationの商標および/または登録商標です。VMwareおよびExploreは、米国およびその他の法域におけるVMware, Inc.またはその子会社の登録商標または商標です。その他の会社名および製品名は、関連する各社の商標である場合があります。機能、価格、可用性、仕様は予告なく変更されることがあります。本プレスリリースには、第三者が作成、管理するVMware以外のWebサイトへのハイパーリンクが含まれている場合がありますが、これらのWebサイト上のコンテンツについては、第三者が単独で責任を負うものとします。