NVIDIA A2 Tensor 核心 GPU

能將 NVIDIA 人工智慧導入任何伺服器的入門級 GPU。

智慧邊緣的入門級推論

NVIDIA A2 Tensor 核心 GPU 提供入門級推論,且耗能低、使用量小、效能高,可於邊緣端提供 NVIDIA 人工智慧。A2 搭載 PCIe Gen4 短卡和低功耗 40-60W 可設定的散熱設計功耗 (TDP) 功能,可為任何大規模部署的伺服器帶來多功能推論加速。

提升最高 20 倍推論效能

部署人工智慧推論可透過智慧的即時體驗改善消費者生活,並從數兆個終端感測器和攝影機中獲得見解。與僅使用 CPU 的伺服器相比,搭載 NVIDIA A2 Tensor 核心 GPU 的邊緣和入門級伺服器可提供高達 20 倍的推論效能,快速升級任何伺服器,以便處理現代人工智慧工作負載。

電腦視覺
(EfficientDet-DO)

02X4X6X8X10X8X1XInference SpeedupNVIDIA A2CPU

自然語言處理 NLP
(BERT-Large)

02X4X6X8X7X1XInference SpeedupNVIDIA A2CPU

文字轉語音 TTS
(Tacotron2 + Waveglow)

05X10X15X20X25X20X1XInference SpeedupNVIDIA A2CPU

NVIDIA A2 Tensor Core GPU 和 dual-socket Xeon Gold 6330N CPU 比較

提升智慧邊緣的智慧影像分析效能

搭載 NVIDIA A2 GPU 的伺服器在智慧邊緣使用案例 (包括智慧城市、製造業和零售業) 可提供高達 1.3 倍的效能。使用 NVIDIA A2 GPU 加速的伺服器執行智慧影像分析工作負載時,部署效率比前幾代 GPU 更高,每元效能提升高達 1.6 倍,能源效率提高了 10%。

IVA 效能 (正規化)

IVA 效能 (正規化)

針對任何伺服器最佳化

NVIDIA A2 針對受空間和散熱需求限制的入門級伺服器 (5G 邊緣和工業環境) 中的推論工作負載和部署進行了最佳化。A2 提供在低耗能環境中執行的小尺寸規格,從 60W 或低至 40W 的散熱設計功耗皆有,對於任何伺服器都是理想選擇。 

低耗能及可調整的熱設計功耗

低耗能及可調整的熱設計功耗

跨雲端、資料中心和邊緣端領先業界的人工智慧推論效能

人工智慧推論持續在推動跨產業的突破性創新,包括消費者網際網路、醫療照護和生命科學、金融服務、零售、製造和超級運算。將 A2 小尺寸和低功耗的優點與 NVIDIA A100A30 Tensor 核心 GPU 結合,便能跨雲端、資料中心和邊緣端提供完整的人工智慧推論組合。A2 和 NVIDIA 人工智慧推論組合可確保部署人工智慧應用程式時,使用的伺服器較少,且功耗更小,進而以更快的速度、更低的成本獲得見解。

跨雲端、資料中心和邊緣端領先業界的人工智慧推論效能

適用於企業

NVIDIA 人工智慧企業

NVIDIA 人工智慧企業是人工智慧與資料分析軟體的端對端雲端原生套件,經過認證,可在採用 VMware vSphere 的監視器虛擬化基礎架構中的 A2 上執行,因此可以在混合式雲端環境中管理和調整人工智慧和推論工作負載。

深入瞭解 NVIDIA 人工智慧企業 ›

運用 MIG 的 A30 可將 GPU 加速的基礎架構使用率提升到最高。
運用 MIG 的 A30 可將 GPU 加速的基礎架構使用率提升到最高。

主流 NVIDIA 認證系統

搭載 NVIDIA A2 的 NVIDIA 認證系統™ 將運算加速以及快速、安全的 NVIDIA 網路融入 NVIDIA OEM 合作夥伴所打造及銷售的企業級資料中心伺服器。此計畫讓客戶能夠在單一高效能、符合成本效益且可擴充的基礎架構上,從 NVIDIA NGC™ 目錄中找出、取得及部署適用於傳統與多元化現代人工智慧應用程式的系統。

深入瞭解 NVIDIA 認證系統 ›

採用 NVIDIA Ampere 架構

NVIDIA Ampere 架構專為彈性運算時代而設計,提供支援現代企業應用程式所需的效能和加速。深入探索全球效能最強且最有彈性的資料中心。

深入瞭解 NVIDIA Ampere 架構 ›

運用 MIG 的 A30 可將 GPU 加速的基礎架構使用率提升到最高。

技術規格

Peak FP32 4.5 TF
TF32 Tensor Core 9 TF | 18 TF¹
BFLOAT16 Tensor Core 18 TF | 36 TF¹
Peak FP16 Tensor Core 18 TF | 36 TF¹
Peak INT8 Tensor Core 36 TOPS | 72 TOPS¹
Peak INT4 Tensor Core 72 TOPS | 144 TOPS¹
RT Cores 10
Media engines 1 video encoder
2 video decoders (includes AV1 decode)
GPU memory 16GB GDDR6
GPU memory bandwidth 200GB/s
Interconnect PCIe Gen4 x8
Form factor 1-slot, low-profile PCIe
Max thermal design power (TDP) 40–60W (configurable)
Virtual GPU (vGPU) software support² NVIDIA Virtual PC (vPC), NVIDIA Virtual Applications (vApps), NVIDIA RTX Virtual Workstation (vWS), NVIDIA AI Enterprise, NVIDIA Virtual Compute Server (vCS)

深入探索 NVIDIA Ampere 架構

探索 NVIDIA Ampere 架構的尖端技術。

Select Location
Middle East