Impulsionando a nova era da IA generativa.
O GB200 NVL72 conecta 36 CPUs Grace e 72 GPUs Blackwell em um design em escala de rack com resfriamento líquido. Ele possui um domínio NVLink de 72 GPUs que age como uma única grande GPU e oferece inferência de grande modelos de linguagem (LLM), com trilhões de parâmetros em tempo real, 30 vezes mais rápida.
O Superchip GB200 Grace Blackwell é um componente fundamental do NVIDIA GB200 NVL72, que conecta duas GPUs NVIDIA Blackwell Tensor Core de alto desempenho e uma CPU NVIDIA Grace™ usando a interconexão NVIDIA NVLink™-C2C às duas GPUs Blackwell.
Destaques
Inferência LLM e eficiência energética: TTL = 50 milissegundos (ms) em tempo real, FTL = 5s, 32.000 entradas/1.000 saídas, NVIDIA HGX™ H100 escalonado sobre InfiniBand (IB) vs. GB200 NVL72, treinamento 1,8T MOE HGX H100 escalonado sobre IB vs. GB200 NVL72 dimensionado sobre IB. Tamanho do cluster: 30.000
Consulta TPC-H 4: GB200 vs. Intel Xeon 8480+
Desempenho projetado sujeito a alterações.
Características
O NVIDIA GB300 NVL72 possui 40 vezes mais desempenho de inferência de IA do que as plataformas Hopper, 40 TB de memória rápida e integração de plataforma de rede com SuperNICs NVIDIA ConnectX®-8 usando Quantum-X800 InfiniBand ou Spectrum™-X Ethernet. O Blackwell Ultra proporciona um desempenho revolucionário nas workloads mais complexas, desde sistemas baseados em agentes e lógica até a geração de vídeo em tempo real 30 vezes mais rápida.
Especificações
GB200 NVL72 | Superchip GB200 Grace Blackwell | |
Configuração | 36 CPU Grace: GPUs 72 Blackwell | 1 CPU Grace: 2 GPUs Blackwell |
Núcleo Tensor FP41 | 1,440 PFLOPS | 40 PFLOPS |
Núcleo Tensor FP8/FP61 | 720 PFLOPS | 20 PFLOPS |
Núcleo Tensor INT81 | 720 POPS | 20 POPS |
FP16/BF16 Tensor Core1 | 360 PFLOPS | 10 PFLOPS |
TF32 Tensor Core | 180 PFLOPS | 5 PFLOPS |
FP32 | 5,760 TFLOPS | 160 TFLOPS |
FP64 | 2,880 TFLOPS | 80 TFLOPS |
Núcleo Tensor FP64 | 2,880 TFLOPS | 80 TFLOPS |
Memória de GPU | Largura de Banda | Até 13.4 TB HBM3e | 576 TB/s | Até 372 GB HBM3e | 16 TB/s |
Largura de Banda NVLink | 130TB/s | 3.6TB/s |
Contagem de Núcleos de CPU | 2,592 Arm® Neoverse V2 cores | 72 Arm Neoverse V2 cores |
Memória de CPU | Largura de Banda | Até 17 TB LPDDR5X | Até 18.4 TB/s | Até 480GB LPDDR5X | Até 512 GB/s |
1. Com escassez. |