專為解決全世界最龐大運算問題而打造。
隨著模型的複雜度大增,加速運算和能源效率對於滿足人工智慧的需求變得至關重要。NVIDIA Grace™ CPU 是一款具備卓越效能和效率的突破性 Arm® CPU,能與 GPU 緊密結合以大幅提升加速運算,或部署為強大、高效率的獨立 CPU。NVIDIA Grace CPU 可為新一代資料中心立下基礎,可用於多種設定,滿足不同資料中心的需求。
NVIDIA GB200 超級晶片結合兩個 NVIDIA Blackwell Tensor 核心 GPU 和一個 Grace CPU,並可使用 NVIDIA® NVLink® 擴展為包含 72 個互連 GPU 的 GB200 NVL72 系統,可加速 30 倍即時大規模語言推論時間。
NVIDIA Grace Hopper™ 超級晶片使用 NVIDIA® NVLink®-C2C 結合 Grace 及 Hopper 架構,為加速人工智慧及高效能運算 (HPC) 應用程式提供 CPU + GPU 一致性記憶體模型。
NVIDIA Grace CPU 超級晶片採用 NVLink-C2C 技術,可提供 144 Arm® Neoverse V2 核心與每秒 1 TB 的記憶體頻寬。
瞭解 NVIDIA Grace CPU 如何驅動最新的大型記憶體超級電腦。
NVIDIA GB200 NVL72 Grace Blackwell 超級晶片是新一代人工智慧架構,可大幅強化即時一兆參數語言模型。
全球首款 HBM3e 處理器,為加速運算和生成式人工智慧時代提供突破性的記憶體和頻寬。
基於 Arm 的 NVIDIA Grace Hopper Superchip、BlueField-3 DPU 和 Aerial SDK 為生成式 AI 和 5G/6G 通信提供革命性的架構。
瞭解採用 NVIDIA Grace CPU 的最新款節能 Arm 超級電腦。
GH200 驅動的系統加入了全球系統製造商正在推出的 400 多種系統配置,以滿足對生成 AI 不斷增長的需求。
了解 QCT 和 Supermicro 如何採用模塊化設計,以快速且經濟高效的方式為廣泛的 AI、高性能計算 (HPC) 和 5G 應用構建多個數據中心配置。
要解決最龐大的人工智慧和高效能運算問題,需要高容量與高頻寬記憶體 (HBM)。第四代 NVIDIA NVLink-C2C 在 NVIDIA Grace CPU 和 NVIDIA GPU 之間提供每秒 900 GB (GB/秒) 的雙向頻寬。此連線的快取一致性整合記憶體位址空間結合系統與高頻寬 GPU 記憶體,簡化可程控功能。在 CPU 與 GPU 之間建立一致的高頻寬連線,是加速處理未來極複雜問題的關鍵。
NVIDIA Grace 是第一個透過錯誤修正程式碼 (ECC) 等機制,運用伺服器級可靠性駕馭 LPDDR5X 記憶體的伺服器 CPU,不僅能滿足資料中心的需求,同時亦提供比現今伺服器記憶體高 2 倍的記憶體頻寬,以及最高 10 倍的能源效率。NVIDIA Grace LPDDR5X 解決方案結合大型、高效能、末級快取,可提供大型模型所需的頻寬,同時降低系統功率,為新一代工作負載提供極致的效能。
隨著 GPU 的平行運算功能持續進步,工作負載仍可能因 CPU 執行的序列工作而受限。快速有效率的 CPU 是系統設計的重要元素,可支援最高的工作負載加速。NVIDIA Grace CPU 整合 Arm Neoverse V2 核心與 NVIDIA 設計的可擴充連貫網狀架構,以節能設計提供高效能讓科學家和研究人員能更輕鬆地完成畢生傑作。
生成式人工智慧需要大量的記憶體和運算資源。NVIDIA GB200 超級晶片採用 380GB HBM 記憶體,提供的 GPU 記憶體頻寬是 NVIDIA H100 Tensor 核心 GPU 的 4.5 倍以上。Grace Blackwell 的高頻寬記憶體透過 NVLink-C2C 與 CPU 記憶體結合,為 GPU 提供大約 860GB 的快速存取記憶體,可為全球最複雜的生成式人工智慧和加速運算工作負載提供所需的記憶體處理容量和頻寬。
NVIDIA 為 NVIDIA Grace 提供深度支援,包含效能調整指南、開發人員工具和函式庫。