La nuova era del computing.
GGB200 NVL72 collega 36 CPU Grace e 72 GPU Blackwell in un design rack-scale e raffreddato a liquido. Vanta un dominio NVLink da 72 GPU che funge da singola GPU di grandi dimensioni e offre un'inferenza LLM in tempo reale da trilioni di parametri 30 volte più veloce.
Il Superchip GB200 Grace Blackwell è un componente chiave di NVIDIA GB200 NVL72, che collega due GPU NVIDIA Blackwell Tensor Core ad alte prestazioni e una CPU NVIDIA Grace™ utilizzando l'interconnessione NVIDIA NVLink™-C2C alle due GPU Blackwell.
In evidenza
Inferenza ed efficienza energetica LLM: TTL = 50 millisecondi (ms) in tempo reale, FTL = 5 s, 32.768 input/1.024 output, NVIDIA HGX™ H100 in scala su InfiniBand (IB) rispetto a GB200 NVL72, training di 1,8 T MOE 4096x HGX H100 in scala su IB rispetto a 456 x GB200 NVL72 in scala su IB. Dimensioni cluster: 32.768
Carico di lavoro di aggregazione e unione nel database con compressione Snappy/Deflate derivata da query TPC-H Q4. Implementazione di query personalizzate per x86, H100 singola GPU e singola GPU da GB200 NLV72 rispetto a Intel Xeon 8480+
Prestazioni previste soggette a modifica.
Caratteristiche
NVIDIA GB300 NVL72 offre prestazioni di inferenza IA 40 volte superiori rispetto alle piattaforme Hopper, 40 TB di memoria veloce e l'integrazione della piattaforma di networking con NVIDIA ConnectX®-8 SuperNIC che utilizzano Quantum-X800 InfiniBand o Spectrum™-X Ethernet. Blackwell Ultra offre prestazioni rivoluzionarie sui carichi di lavoro più complessi, dai sistemi per agenti e il ragionamento alla generazione di video in tempo reale 30 volte più veloce.
Specifiche
GB200 NVL72 | Superchip Grace Blackwell GB200 | |
Configurazioni | 36 CPU Grace: 72 GPU Blackwell | 1 CPU Grace: 2 GPU Blackwell |
FP4 Tensor Core1 | 1.440 PFLOPS | 40 PFLOPS |
FP8/FP6 Tensor Core1 | 720 PFLOPS | 20 PFLOPS |
INT8 Tensor Core1 | 720 POPS | 20 POPS |
FP16/BF16 Tensor Core1 | 360 PFLOPS | 10 PFLOPS |
TF32 Tensor Core | 180 PFLOPS | 5 PFLOPS |
FP32 | 5.760 TFLOPS | 160 TFLOPS |
FP64 | 2.880 TFLOPS | 80 TFLOPS |
FP64 Tensor Core | 2.880 TFLOPS | 80 TFLOPS |
Memoria della GPU | Larghezza di banda | Fino a 13,4 TB HBM3e | 576 TB/s | Fino a 372 GB HBM3e | 16 TB/s |
Banda NVLink | 130 TB/s | 3,6 TB/s |
Numero di core CPU | 2.592 Core Arm® Neoverse V2 | 72 Core Arm Neoverse V2 |
Memoria della CPU | Larghezza di banda | Fino a 17 TB LPDDR5X | Fino a 18,4 TB/s | Fino a 480 GB | Fino a 512 GB/s |
1. Con densità. |