NVIDIA がA30 および A10 GPU を含む、エンタープライズサーバー用GPUでAI 推論の記録を達成

NVIDIA AI プラットフォームが、データセンターからエッジまで、すべての MLPerf カテゴリで記録を更新

2021 年 4 月 21 日　カリフォルニア州サンタクララ — NVIDIA は本日、メインストリームサーバー用 GPU である NVIDIA^® A30 GPUおよび A10 GPU が新たに追加された NVIDIA の AI 推論プラットフォームが、MLPerf の最新ラウンドにおけるすべてのカテゴリで記録的なパフォーマンスを達成したことを発表しました。

MLPerf は、コンピュータービジョン、医用画像、レコメンダーシステム、音声認識、自然言語処理といったさまざまなワークロードにわたって AI パフォーマンスを測定する、業界標準のベンチマークです。

今回初めて MLPerf に登場した NVIDIA A30 GPUおよび A10 GPU は、高いパフォーマンスと低消費電力を兼ね備え、AI 推論、トレーニング、グラフィックス、および従来のエンタープライズ向けのコンピューティングワークロードに至るまで、幅広いメインストリームのオプションを企業に提供します。Cisco、Dell Technologies、Hewlett Packard Enterprise、およびLenovoが今夏より、大量に出荷されている自社のサーバーにこれらの GPU を搭載する予定です。

NVIDIA は今回の成果を達成するにあたり、さまざまな GPU や TensorRT™ や NVIDIA Triton™ Inference Server といった AI ソフトウェアで構成される NVIDIA AI プラットフォームをフル活用しました。TensorRT™ や NVIDIA Triton™ Inference Serverは Microsoft、Pinterest、 Postmates、 T-Mobile、 USPS や WeChat といった大手企業にすでに採用されています。

NVIDIA のアクセラレーテッドコンピューティング部門ゼネラルマネージャー兼バイスプレジデントであるイアンバック (Ian Buck) は次のように述べています。「AI があらゆる業界に変革をもたらし続ける中、MLPerf は、企業が IT インフラストラクチャへの投資において情報に基づく決定を下すために、その重要性がますます高まってきています。今や大手 OEM はすべて MLPerf の結果を提出しており、NVIDIA とパートナーが目下注力しているのは、世界をリードする性能を AI にもたらすことに留まらず、新しい A30 GPU および A10 GPU を搭載したエンタープライズ向けサーバーの波によって AI を民主化することです。」

MLPerf の結果
NVIDIA はデータセンターおよびエッジカテゴリにおけるすべてのテストについて結果を提出している唯一の企業であり、MLPerf のすべてのワークロードにおいてトップの性能を達成しています。

また、Triton Inference Server を使用した結果も複数提出しています。Triton Inference Server は、主要なフレームワークのモデルをすべてサポートし、GPU だけでなく CPU でも実行でき、バッチ、リアルタイム、ストリーミングといったさまざまなクエリタイプに最適化できるため、AI をアプリケーションに展開する際の複雑さを軽減します。今回 Triton の結果を提出したことで、GPU 実装および CPU 実装における最高の最適化に近いパフォーマンスを、同等の構成で達成しました。

NVIDIA はまた、NVIDIA Ampere アーキテクチャのMulti-Instance GPU （以下MIG）機能を使用した結果を提出したことで新境地を開拓しました。7 つの MIG インスタンスを使用する単一の GPU で 7 つの MLPerf オフラインテストすべてを同時に実行したのです。この構成でも、単一の MIG インスタンスで実行された結果と比較してほぼ同じ性能が観測されました。

こうした結果を提出したことで MIG のパフォーマンスと汎用性が実証され、インフラストラクチャの管理者は特定のアプリケーションに適切なサイズの GPU コンピューティングをプロビジョニングして、データセンターのすべての GPU から最大の出力を引き出せるようなります。

NVIDIAからの提出だけでなく、富士通株式会社、Alibaba Cloud、 Dell Technologies、 GIGABYTE、 HPE、Lenovoおよび Supermicroといった NVIDIAのパートナーからも NVIDIA GPU を使用したテスト結果が360以上提出されました。

拡大し続けるNVIDIA のAI プラットフォーム
NVIDIA A30 GPU および A10 GPU は、NVIDIA AI プラットフォームに追加された最新製品です。NVIDIA AI プラットフォームには他にも、NVIDIA Ampere アーキテクチャ GPU、NVIDIA Jetson™ AGX Xavier、Jetson Xavier NX、ならびに AI を高速化するために最適化された NVIDIA ソフトウェアのフルスタックが備わっています。

A30 は、業界標準のサーバーに多様なパフォーマンスを提供し、レコメンダーシステム、対話型 AI、コンピュータービジョンなど、AI 推論やメインストリームのエンタープライズ向けコンピューティングワークロードを幅広くサポートしています。

NVIDIA A10 GPUはディープラーニング推論、インタラクティブレンダリング、コンピューター支援設計 (CAD)、クラウドゲーミングなどを高速化し、企業は共通のインフラストラクチャで AI とグラフィックスの混合ワークロードに対応できるようになります。NVIDIA 仮想 GPU ソフトウェアを使用することで管理が合理化され、設計者、エンジニア、アーティスト、科学者が使用する仮想デスクトップの使用率やプロビジョニングが改善されます。

NVIDIA Jetson プラットフォームは NVIDIA Xavier™ System-on-Module をベースとしており、サーバークラスの AI パフォーマンスをエッジに提供し、ロボティクス、ヘルスケア、小売、スマートシティといったさまざまな分野での利用が可能です。NVIDIA の統合アーキテクチャと CUDA-X™ ソフトウェアスタックで構築された Jetson は、コンパクトな設計ですべてのエッジワークロードを、消費電力 30W 未満で実行できる唯一のプラットフォームです。

提供状況
NVIDIA A100 GPU は、大手メーカーのサーバーと、すべての主要クラウドサービスプロバイダーのクラウドで利用できます。また、A100 GPU は NVIDIA DGX Station A100、NVIDIA DGX A100、NVIDIA DGX SuperPOD など、NVIDIA DGX™ システムポートフォリオ全体に搭載されています。

消費電力がわずか165WのA30、および150Wの A10 は、幅広いワークロードに高いパフォーマンスを提供するために厳格なテストを経た NVIDIA-Certified Systems™ などのさまざまなサーバーへの搭載が今夏より予定されています。

Jetson AGX Xavier および Jetson Xavier NX System-on-Module は、世界中の販売代理店から現在提供中です。

NVIDIA Triton と NVIDIA TensorRT はどちらも、NVIDIA のソフトウェアカタログである NGC™ より入手可能です。

NVIDIA について
1999年における NVIDIA (NASDAQ表示: NVDA) による GPU の発明は、PC ゲーミング市場の成長に爆発的な拍車をかけ、現代のコンピューターグラフィックス、ハイパフォーマンスコンピューティング、そして人工知能 (AI) を再定義しました。NVIDIA のアクセラレーテッドコンピューティングと AI における先駆的な取り組みは、輸送、ヘルスケア、製造業などの数兆ドル規模の産業を再構築し、その他のさまざまな産業の拡大も加速させています。詳細は、こちらのリンクから： https://nvidianews.nvidia.com/

AI推論およびAIプラットフォーム、A30 GPU、A10 GPU、Triton Inference Server、Multi-Instance GPU、NVIDIA仮想GPUソフトウェア、NVIDIA Jetsonを含むNVIDIAの製品および技術の利点、性能、影響、今夏GPUをサーバに統合する予定の企業、NVIDIA製品を導入している企業、AIによるあらゆる産業の変革、MLPerfの重要性、どのOEMが結果を提出しているか、NVIDIAによるAIの民主化、MIGが可能にすること、NVIDIA A100、A30、A10 GPU、Jetson AGX Xavier、Jetson Xavier NX system on-a-module、NVIDIA Triton、NVIDIA Tensor RTの利用可能性、NVIDIAが記録的なパフォーマンスを記録したことなど、本プレスリリースにおける一定の記載は将来の見通しに関する記述であり、予測とは著しく異なる結果を生ずる可能性があるリスクと不確実性を伴っています。かかるリスクと不確実性は、世界的な経済環境、サードパーティに依存する製品の製造・組立・梱包・試験、技術開発および競合による影響、新しい製品やテクノロジの開発あるいは既存の製品やテクノロジの改良、NVIDIA製品やパートナー企業の製品の市場への浸透、デザイン・製造あるいはソフトウェアの欠陥、ユーザーの嗜好および需要の変化、業界標準やインターフェイスの変更、システム統合時にNVIDIA製品および技術の予期せぬパフォーマンスにより生じる損失などを含み、その他のリスクの詳細に関しては、Form 10-K での NVIDIA のアニュアルレポートならびに Form 10-Q での四半期レポートなど、米証券取引委員会 (SEC) に提出されている NVIDIA の報告書に適宜記載されます。SEC への提出書類は写しが NVIDIA の Web サイトに掲載されており、NVIDIA から無償で入手することができます。これらの将来予測的な記述は発表日時点の見解に基づくものであって将来的な業績を保証するものではなく、法律による定めがある場合を除き、今後発生する事態や環境の変化に応じてこれらの記述を更新する義務を NVIDIA は一切負いません。

©2021 NVIDIA Corporation. All rights reserved. NVIDIA 、NVIDIA のロゴ、CUDA-X、DGX、DGX Station、Jetson、Jetson AGX Xavier、NGC、NVIDIA DGX SuperPOD, NVIDIA Triton, NVIDIA-Certified Systems、 TensorRT および Xavierは米国およびその他の国における NVIDIA Corporationの商標または登録商標です。その他の会社名および製品名は、それぞれの所有企業の商標または登録商標である可能性があります。機能、価格、利用の可否および仕様は予告なく変更される場合があります。

NVIDIA がA30 および A10 GPU を含む、エンタープライズ サーバー用GPUでAI 推論の記録を達成

NVIDIA がA30 および A10 GPU を含む、エンタープライズサーバー用GPUでAI 推論の記録を達成