NVIDIA、AI 推論でパフォーマンスの記録を更新

NVIDIA A100 が CPU よりも最大 237 倍速い AI 推論を実現し、
MLPerf ベンチマークのリードを拡大、企業は AI を研究から実稼働へ移すことが可能に

2020 年 10 月 21 日、カリフォルニア州サンタクララ — NVIDIA はこのたび、NVIDIA の AI コンピューティングプラットフォームが MLPerf の最新ラウンドで再びパフォーマンスの記録を更新し、ハードウェア、ソフトウェア、サービスの AI パフォーマンスを測定する業界唯一の独立系ベンチマークでリードを広げたことを発表しました。

NVIDIA は、MLPerf 推論の第 2 バージョンにおいて、データセンターおよびエッジコンピューティングシステム向けの全 6 応用分野のテストすべてで勝利を収めました。このテストは、コンピュータービジョン向けの当初の 2 つのテストに加えて、AI で最も速く成長している 4 つの分野であるレコメンデーションシステム、自然言語理解、音声認識、医用画像を網羅しています。

幅広い業界にわたる組織が、すでに NVIDIA^® A100 Tensor コア GPU の卓越した推論パフォーマンスを利用して、AI を研究から日々の業務へと移行しています。金融機関は対話型 AI を使って顧客の質問により早く答え、小売業者は AI を使って常に在庫を補充し、医療機関は AI を使って何百万枚もの医用画像を分析することで、病気をより正確に特定し、人命を救うのに役立てています。

NVIDIA のゼネラルマネージャー兼アクセラレーテッドコンピューティング担当バイスプレジデントであるイアンバック (Ian Buck) は次のように述べています。「私たちは転換点におり、あらゆる業界が AI を応用して新しいサービスを提供し、自社のビジネスを成長させるためのより良い方法を模索しています。MLPerf で今回の結果を出すために NVIDIA が成し遂げてきたことは、私たちの日常生活を向上させる新しいレベルの AI パフォーマンスを企業に提供します」

MLPerf の最新結果は、AI 推論が劇的な成長を遂げてきたため、NVIDIA の足跡のようになっています。5 年前、GPU を推論に使っていたのはほんの一握りの大手ハイテク企業だけでした。現在では、NVIDIA の AI プラットフォームはすべての主要なクラウドおよびデータセンターインフラストラクチャーのプロバイダーを通じて提供されており、幅広い業界の企業が AI 推論プラットフォームを使ってビジネス活動を向上させ、付加的なサービスを提供しています。

さらに、NVIDIA GPU は、パブリッククラウドで CPU よりも多くの AI 推論能力を初めて提供するようになりました。NVIDIA GPU のクラウド AI 推論コンピューティング能力の合計は、2 年ごとに約 10 倍伸びています。

NVIDIA が AI 推論を新たな高みに引き上げる

NVIDIA とそのパートナーは、NVIDIA のデータセンター GPU、エッジ AI アクセラレーター、NVIDIA に最適化されたソフトウェアを含む、NVIDIA のアクセラレーションプラットフォームを使って MLPerf 0.7 の結果を提出しました。

今年の前半に発表された NVIDIA A100 は、第 3 世代の Tensor コアと Multi-Instance GPU テクノロジーを特徴としており、ResNet-50 テストでは CPU に 30 倍の差をつけて勝利しました (前回のラウンドでは CPU に 6 倍の差をつけていました)。さらに、A100 は新しく追加されたデータセンター向け推論のレコメンダーテストでは、最新の CPU を最大 237 倍上回るパフォーマンスを出しました (MLPerf 推論 0.7 ベンチマークに準拠)。

これは、1 台の NVIDIA DGX A100™ システムで約 1,000 台のデュアルソケット CPU サーバーと同じパフォーマンスを実現できるということであり、お客様が AI レコメンダーモデルを研究から実稼働に移す際に、きわめて高い費用対効果を提供できることを意味します。

このベンチマークはまた、主流のエンタープライズ向けエッジサーバーや、費用対効果の高いクラウドインスタンスにとって、NVIDIA T4 Tensor コア GPU が引き続き、堅実な推論プラットフォームであることも示しています。NVIDIA T4 GPU は同じテストで CPU を最大 28 倍上回っています。さらに、NVIDIA Jetson AGX Xavier™ は、SoC ベースのエッジデバイスの中で首位のパフォーマンスを見せています。

このような結果を出すには、高度に最適化されたソフトウェアスタックが必要でした。これには NVIDIA TensorRT™ 推論オプティマイザーと NVIDIA Triton™ 推論サーバーソフトウェアが含まれ、どちらも NVIDIA のソフトウェアカタログである NGC™ で入手できます。

NVIDIA からの提出に加え、NVIDIA の 11 のパートナーも NVIDIA GPU を使って合計 1,029 の結果を提出し、提出全体の 85% 以上はデータセンターとエッジカテゴリーのものでした。

NVIDIA について
1999 年における NVIDIA (NASDAQ 表示: NVDA) による GPU の発明は、PC ゲーミング市場の成長に爆発的な拍車をかけ、現代のコンピューターグラフィックスを再定義し、並列コンピューティングに革命的変化を起こしました。最近では、GPU ディープラーニングが最新の AI (次世代コンピューティング) に火をつけ、世界を知覚し理解することができるコンピューター、ロボット、自律走行車の脳として GPU は機能しています。詳細は、こちらのリンクから: www.nvidia.com/ja-jp/

NVIDIA が MLPerf ベンチマークでリードを広げておりビジネスを可能にしていること、NVIDIA が記録を更新していること、組織がいかに NVIDIA A100 Tensor コア GPU を使用しているか、NVIDIA A100、DGX A100、NVIDIA T4 Tensor コア GPU、NVIDIA Jetson AGX Xavier を含む NVIDIA GPU のメリット、性能、および影響、業界が AI を応用して自社のビジネスを成長させるより良い方法を模索していること、NVIDIA が私たちの日常生活を向上させる新しいレベルの AI パフォーマンスを企業に提供していること、企業が NVIDIA の AI 推論プラットフォームを使ってビジネス活動を向上させサービスを提供していること、NVIDIA が AI 推論を新たな高みに引き上げることなど、本プレスリリースにおける一定の記載は将来の見通しに関する記述であり、予測とは著しく異なる結果を生ずる可能性があるリスクと不確実性を伴っています。かかるリスクと不確実性は、世界的な経済環境、サードパーティーに依存する製品の製造・組立・梱包・試験、技術開発および競合による影響、新しい製品やテクノロジーの開発あるいは既存の製品やテクノロジーの改良、NVIDIA製品やパートナー企業の製品の市場への浸透、デザイン・製造あるいはソフトウェアの欠陥、ユーザーの嗜好および需要の変化、業界標準やインターフェイスの変更、システム統合時にNVIDIA製品および技術の予期せぬパフォーマンスにより生じる損失などを含み、その他のリスクの詳細に関しては、Form 10-K での NVIDIA のアニュアルレポートならびに Form 10-Q での四半期レポートなど、米証券取引委員会 (SEC) に提出されている NVIDIA の報告書に適宜記載されます。SEC への提出書類は写しが NVIDIA の Web サイトに掲載されており、NVIDIA から無償で入手することができます。これらの将来予測的な記述は発表日時点の見解に基づくものであって将来的な業績を保証するものではなく、法律による定めがある場合を除き、今後発生する事態や環境の変化に応じてこれらの記述を更新する義務を NVIDIA は一切負いません。

© 2020 NVIDIA Corporation. All rights reserved. NVIDIA、NVIDIA のロゴ、DGX A100、Jetson AGX Xavier、NGC、NVIDIA Triton、および TensorRT は、米国およびその他の国における NVIDIA Corporation の商標または登録商標です。その他の商標および著作権はすべて、それぞれの所有者の財産です。