利用神經網絡識別現有數據中的模式和結構,生成式 AI 的應用能使用戶能夠從各種輸入和輸出中生成新的原創內容,包括圖像、聲音、動畫和 3D 模型。利用 NVIDIA AI Enterprise 中包含的 NVIDIA 生成式 AI 解決方案 NeMo™ Framework 以及 A800 40GB Active GPU,實現輕鬆、快速且可自訂的生成式 AI 模型開發。
NVIDIA® A800 40GB Active GPU 採用 NVIDIA Ampere 架構,是終極工作站開發平台,包含 NVIDIA AI Enterprise 軟體,可提供強大的效能進而加速新一代資料科學、AI、資料分析和 HPC 應用程式。
9.7 TFLOPS¹
623.8 TFLOPS¹
1.5 TB/秒
1 GPU 加速時脈的峰值速率
NVIDIA A800 40GB Active GPU 提供令人驚豔的超高效能,可應對工作站平台上要求苛刻的工作流程,從 AI 訓練和推論,至複雜的模擬、建模和資料分析。憑藉超越前一代的2 倍效能,A800 40GB Active 可完美支援各種運算密集型工作負載。
ResNet-50 V1.5 Training. Batch Size=256; Precision=Mixed.
BERT Large Pre-Training Phase 2 Batch Size=8; Precision=Mixed.
GTC Version 4.5, TAE, Precision=FP32.
LAMMPS patch_8Feb2023, Atomic Fluid Lennard-Jones 2.5 (cutoff); Precision=FP64.
ResNet-50 V1.5 Inference. Batch Size=128; Precision=Mixed.
BERT Large Inference. Batch Size=128; Precision=INT8.
使用 A800 40GB Active、Quadro GV100 GPU 以及 Intel Xeon Gold 6126 處理器進行效能測試。
使用搭載 NVIDIA RTX™ 的 AI 工作站,將超級電腦的強大功能傳輸到桌上型電腦,從而減輕對資料中心資源的需求。配備最新的 NVIDIA RTX GPU 的工作站平台可提供強大的 AI 效能,用於建置、訓練和部署新一代 AI 增強應用及模型。使用世界上最先進的 AI 平台加速開發、培訓和推論工作負載並大規模簡化部署。
GPU 記憶體 | 40GB HBM2 |
記憶體介面 | 5,120 位 |
記憶體頻寬 | 1,555.2 GB/秒 |
CUDA 核心 | 6,912 |
Tensor 核心 | 432 |
雙精度效能 | 9.7 兆次浮點運算 |
單精度效能 | 19.5 兆次浮點運算 |
峰值 Tensor 效能 | 623.8 兆次浮點運算 |
多執行個體GPU | 最多 7 個 MIG 實例 @ 5GB |
NVIDIA NVLink | 是的 |
NVLink 頻寬 | 400GB/秒 |
繪圖匯流排 | PCIe 4.0×16 |
最大功耗 | 240瓦 |
散熱 | 主動 |
尺寸 | 4.4” 高 x 10.5” 長,雙槽 |
顯示能力* | - |
*A800 40GB Active 未配備顯示埠。需要 NVIDIA RTX 4000 Ada Generation、NVIDIA RTX A4000 或 NVIDIA T1000 GPU 才能支援顯示輸出功能。 |