This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

NVIDIA A2 Tensor コア GPU

NVIDIA AI をあらゆるサーバーにもたらすエントリレベル GPU。

インテリジェントエッジのためのエントリレベル推論

NVIDIA A2 Tensor コア GPU は、エッジにおける NVIDIA AI のために、低電力、小占有面積、ハイパフォーマンスでエントリレベル推論を提供します。薄型 PCIe Gen4 カードと 40-60W の低電力で設定可能な TDP (熱設計電力) を特徴とする A2 は、大規模展開であらゆるサーバーに用途の広い推論高速化を提供します。

NVIDIA A2 データシートをダウンロード (538 KB)

NVIDIA A2 製品概要をダウンロード (362 KB)

最大 20 倍の推論性能

AI 推論は、スマートでリアルタイムな体験で消費者の生活の質を高め、エンドポイントに設置された無数のセンサーとカメラからインサイトを得るために展開されます。CPU のみのサーバーと比較した場合、NVIDIA A2 Tensor コア GPU 搭載のエッジおよびエントリレベルのサーバーは、推論で最大 20 倍のパフォーマンスを発揮し、最新の AI を処理できるよう、あらゆるサーバーを一瞬でアップグレードします。

コンピュータービジョン
(EfficientDet-DO)

自然言語処理 NLP
(BERT-Large)

テキスト読み上げ TTS
(Tacotron2 + Waveglow)

1 基の NVIDIA A2 Tensor コア GPU とデュアルソケット Xeon Gold 6330N CPU の比較。

システム構成: [CPU: HPE DL380 Gen10 Plus、2S Xeon Gold 6330N @2.2GHz、512GB DDR4]
NLP: BERT-Large (配列の長さ: 384、SQuAD: v1.1) | TensorRT 8.2、Precision: INT8、BS:1 (GPU) | OpenVINO 2021.4、Precision: INT8, BS:1 (CPU)
テキスト読み上げ: Tacotron2 + Waveglow エンドツーエンドパイプライン (入力の長さ: 128) | PyTorch 1.9、Precision: FP16、BS:1 (GPU) | PyTorch 1.9、Precision: FP32、BS:1 (CPU)
コンピュータービジョン: EfficientDet-D0 (COCO、512x512) | TensorRT 8.2、Precision: INT8、BS:8 (GPU) | OpenVINO 2021.4、Precision: INT8、BS:8 (CPU)

インテリジェントエッジのための高度な
IVA パフォーマンス

NVIDIA A2 GPU を搭載したサーバーは、スマートシティ、製造業、小売業などのインテリジェントエッジなどの用途において、最大 1.3 倍のパフォーマンスを発揮します。IVA ワークロードを実行する NVIDIA A2 GPU は、前世代の GPU に比べて価格性能が最大 1.6 倍、エネルギー効率が 10% 向上し、より効率的な展開を提供します。

IVA 性能 (正規化)

システム構成: [Supermicro SYS-1029GQ-TRT、2S Xeon Gold 6240 @2.6GHz、768GB DDR4、1x NVIDIA A2 または 1x NVIDIA T4] | パフォーマンスは Deepstream 5.1 で測定ネットワーク: ShuffleNet-v2 (224x224)、MobileNet-v2 (224x224)。| パイプラインはビデオキャプチャとデコード、事前処理、バッチ処理、事後処理の e2e パフォーマンスを表します。

あらゆるサーバーに合わせて最適化

NVIDIA A2 は、5G や産業環境など、スペースや温度の要件によって制約されるエントリレベルサーバーの推論ワークロードおよびデプロイに合わせて最適化されています。A2 は、TDP 60W から 40W まで、低電力エンベロープで動作する薄型フォームファクターを可能にするため、あらゆるサーバーに最適です。

低電力で構成可能な TDP

クラウドで、データセンターで、エッジで、業界をリードする AI 推論パフォーマンス

AI 推論は、Web サービス、ヘルスケアとライフサイエンス、金融サービス、小売、製造、スーパーコンピューティングなど、さまざまな産業で画期的なイノベーションを推進し続けています。A2 の低電力な小型フォームファクターと、NVIDIA A100 や A30 Tensor コア GPU との組み合わせで、クラウド、データセンター、エッジにまたがる、完全な AI 推論ポートフォリオを提供します。A2 と NVIDIA AI 推論ポートフォリオにより、AI アプリケーションのデプロイにおいて、サーバーの数を減らし、電力を低くすることができます。結果的に、コストを大幅に下げつつ、インサイトをより速く得ることができます。

企業利用に対応

NVIDIA AI Enterprise

NVIDIA AI Enterprise は、AI とデータ分析ソフトウェアのエンドツーエンドのクラウドネイティブスイートです。VMware vSphere が含まれるハイパーバイザーベースの仮想インフラストラクチャにおいて、A2 上で実行できることが認定されています。これにより、ハイブリッドクラウド環境で AI および推論ワークロードを管理、拡張できます。

NVIDIA AI Enterprise の詳細を見る ›

A30 と MIG の組み合わせにより GPU 対応インフラストラクチャの使用率を最大化

メインストリームの NVIDIA-Certified Systems

NVIDIA A2 を搭載した NVIDIA-Certified Systems™ は、NVIDIA の OEM パートナーが構築および販売するエンタープライズデータセンターサーバーにおいて、コンピューティングが加速する上、高速かつ安全な NVIDIA ネットワーキングを実現します。このプログラムにより、お客様は、費用対効果が高くスケーラブルな 1 つの高性能インフラストラクチャで、NVIDIA NGC™ カタログ内の多彩な最新 AI アプリケーションに対応したシステムを特定、入手、展開することができます。

NVIDIA-Certified Systems の詳細を見る ›

NVIDIA Ampere アーキテクチャのパワー

NVIDIA Ampere アーキテクチャは、エラスティックコンピューティング時代のために設計されており、現代の企業向けアプリケーションのパワーとなるために必要なパフォーマンスと高速化を提供します。世界最高クラスのパフォーマンスを誇るエラスティックなデータセンターの心臓部をご覧ください。

NVIDIA Ampere アーキテクチャの詳細を見る ›

技術仕様

Peak FP32	4.5 TF
TF32 Tensor Core	9 TF \| 18 TF¹
BFLOAT16 Tensor Core	18 TF \| 36 TF¹
Peak FP16 Tensor Core	18 TF \| 36 TF¹
Peak INT8 Tensor Core	36 TOPS \| 72 TOPS¹
Peak INT4 Tensor Core	72 TOPS \| 144 TOPS¹
RT Cores	10
Media engines	1 video encoder 2 video decoders (includes AV1 decode)
GPU memory	16GB GDDR6
GPU memory bandwidth	200GB/s
Interconnect	PCIe Gen4 x8
Form factor	1-slot, low-profile PCIe
Max thermal design power (TDP)	40–60W (configurable)
Virtual GPU (vGPU) software support^²	NVIDIA Virtual PC (vPC), NVIDIA Virtual Applications (vApps), NVIDIA RTX Virtual Workstation (vWS), NVIDIA AI Enterprise, NVIDIA Virtual Compute Server (vCS)

¹ 疎性あり
² 将来の vGPU リリースでサポート予定

NVIDIA Ampere アーキテクチャの技術詳細

NVIDIA Ampere アーキテクチャの最先端技術をご覧ください。

詳細を見る