NVIDIA A800 40GB Active 顯示卡

適用於資料科學和 HPC 的終端工作站開發平台

銷售據點

尋找 NVIDIA 設計及視覺化合作夥伴。

尋找合作夥伴

規格表 | 詳細資料

概覽

合作夥伴

工作站超級運算平台

NVIDIA® A800 40GB Active GPU 採用 NVIDIA Ampere 架構，是終極工作站開發平台，包含 NVIDIA AI Enterprise 軟體，可提供強大的效能進而加速新一代資料科學、AI、資料分析和 HPC 應用程式。

開始使用 NVIDIA A800 40GB Active

了解如何設定搭載 GPU 的 NVIDIA A800 40GB Active 進行顯示，並啟動 NVIDIA AI Enterprise 授權。

觀看影片

產品亮點

業界領先的超高效能

雙精度 (FP64) 效能

9.7 TFLOPS¹

Tensor 效能

623.8 TFLOPS¹

記憶體頻寬

1.5 TB/秒

¹ GPU 加速時脈的峰值速率

特色

搭載 NVIDIA Ampere 架構

第三代 Tensor 核心

為各種 AI 和 HPC 應用提供高效能和多功能性，支援雙精度 (FP64) 和 Tensor Float 32 (TF32) 精度，性能和效率比上一代產品高出 2 倍。對結構稀疏性的硬體支援將推理吞吐量提高一倍。

多執行個體 GPU

具有專用高頻寬記憶體、快取和運算核心的硬體等級完全隔離和安全的多用戶硬體層級。多執行個體 GPU (MIG) 可最大限度地利用 GPU 加速基礎設施，允許將 A800 40GB 活動 GPU 劃分為多達 7 個獨立實例，從而使多個使用者能夠存取 GPU 加速。

第三代 NVIDIA NVLink

增加的 GPU 到 GPU 互連頻寬提供了單一可擴展記憶體來加速運算工作負載並處理更大的資料集。透過使用 NVIDIA NVLink® 連接一對 NVIDIA A800 40GB Active GPU，可將有效記憶體佔用量增加至 80GB，從而擴展到具有 80GB 記憶體的多個 GPU，並透過支援 GPU 到 GPU 的資料傳輸速率高達 400GB/ 來擴展應用程式效能（可雙向）。

超高速 HBM2 記憶體

具有 40GB 高速 HBM2 記憶體具有業界領先的 1,555 GB/秒記憶體頻寬，與上一代相比增加 70% 以上。此外，內建更多晶片內存，包括 40MB 2 級緩存，可提供巨大的運算量。加速最具運算負載強度的 AI 和 HPC 工作負載。

深入瞭解 NVIDIA Ampere GPU 架構

工作負載

增強跨產業的 AI 和 HPC 工作流程

生成式 AI

利用神經網絡識別現有數據中的模式和結構，生成式 AI 的應用能使用戶能夠從各種輸入和輸出中生成新的原創內容，包括圖像、聲音、動畫和 3D 模型。利用 NVIDIA AI Enterprise 中包含的 NVIDIA 生成式 AI 解決方案 NeMo™ Framework 以及 A800 40GB Active GPU，實現輕鬆、快速且可自訂的生成式 AI 模型開發。

Montage of a sunset view, a protein, and a toy Jensen.

工程模擬 / 電腦輔助工程 (CAE)

A800 40GB Active GPU 為 GPU 加速的電腦輔助工程 (CAE) 應用程式展現卓越的效能。工程分析師和 CAE 專家可以用驚人的速度以 FP64 全方位精度運行大規模模擬和工程分析程式碼，從而減少開發時間並加快創造價值的速度。

透過搭載 RTX 加速的 GPU，為設計師和工程師前置處理和後置處理提供顯示功能，可以以全面的設計保真度可視化大型模擬和模型。

Simulated image of an engine — Image credit: Dassault Systèmes

資料科學和資料分析

利用強大的效能加速端到端資料科學和分析工作流程，快速從大規模資料集中提取有價值的觀點。透過將 A800 40GB Active 的高效能運算能力與 NVIDIA AI Enterprise 結合，資料使用專家可以利用大量程式庫、工具和技術來加速資料科學工作流程進行資料準備、分析，並進行建模。

Computer accessing a data base and extracting insights.

AI 訓練與推論

將資料中心和雲端的運算資源轉載到您的電腦桌面上，實現超級計算性能，讓您可以輕鬆處理本地AI訓練和推論的工作負載。具備四個 A800 40GB Active GPU 的強大工作站可以提供超過 2.5 petaflops 的 AI 運算效能和 160GB 組合 HBM2 記憶體。

Process of taking an LLM, optimizing it, and deploying an end solution.

人工智慧平台

透過 NVIDIA AI Enterprise 實現生產就緒的 AI

開箱即用的人工智慧開發

每個 NVIDIA A800 40GB Active GPU 均隨附 NVIDIA AI Enterprise 的三年訂閱，其為一個端對端企業軟體平台，用於快速開發和部署可投入生產的生成式 AI、電腦視覺、語音 AI 等應用。需要軟體啟用。

加速數據管道

NVIDIA AI Enterprise 包含資料科學庫和工具，可加快獲取洞察的速度。企業可使用 NVIDIA RAPIDS™ Accelerator Apache Spark 將資料處理時間加速 5 倍，同時將營運成本降低 4 倍，並使用 NVIDIA RAPIDS 將端到端資料科學管道的速度提高 50 倍。

人工智慧訓練與推論

NVIDIA AI Enterprise 加速 AI 旅程的每個階段，從資料準備和模型訓練到推論和大規模部署：

使用 NVIDIA TAO 存取預先訓練模型
使用 NVIDIA® TensorRT 優化推論
使用 NVIDIA Triton™ 推論伺服器進行大規模部署

深入瞭解 NVIDIA AI Enterprise

效能

應對要求苛刻的 AI 和 HPC 工作負載

NVIDIA A800 40GB Active GPU 提供令人驚豔的超高效能，可應對工作站平台上要求苛刻的工作流程，從 AI 訓練和推論，至複雜的模擬、建模和資料分析。憑藉超越前一代的2 倍效能，A800 40GB Active 可完美支援各種運算密集型工作負載。

AI Training - ResNet-50 V1.5

ResNet-50 V1.5 Training. Batch Size=256; Precision=Mixed.

AI Training - BERT - Large

BERT Large Pre-Training Phase 2 Batch Size=8; Precision=Mixed.

HPC - GTC

GTC Version 4.5, TAE, Precision=FP32.

HPC - LAMMPS

LAMMPS patch_8Feb2023, Atomic Fluid Lennard-Jones 2.5 (cutoff); Precision=FP64.

AI Inference - ResNet-50 V1.5

ResNet-50 V1.5 Inference. Batch Size=128; Precision=Mixed.

AI Inference - BERT - Large

BERT Large Inference. Batch Size=128; Precision=INT8.

使用 A800 40GB Active、Quadro GV100 GPU 以及 Intel Xeon Gold 6126 處理器進行效能測試。

桌上型工作站上的超級運算效能

使用搭載 NVIDIA RTX™ 的 AI 工作站，將超級電腦的強大功能傳輸到桌上型電腦，從而減輕對資料中心資源的需求。配備最新的 NVIDIA RTX GPU 的工作站平台可提供強大的 AI 效能，用於建置、訓練和部署新一代 AI 增強應用及模型。使用世界上最先進的 AI 平台加速開發、培訓和推論工作負載並大規模簡化部署。

深入瞭解搭載 NVIDIA RTX 的 AI 工作站

規格