Impulsionando a nova era da IA generativa.
Visão Geral
O GB200 NVL72 conecta 36 CPUs Grace e 72 GPUs Blackwell em um design em escala de rack e resfriado por líquido. Ele possui um domínio NVIDIA NVLink™ de 72 GPUs que age como uma GPU única e enorme e oferece uma inferência de grandes modelos de linguagem (LLM) 30 vezes mais rápida em tempo real.
O Superchip GB200 Grace Blackwell é um componente importante do NVIDIA GB200 NVL72, conectando duas GPUs NVIDIA Blackwell Tensor Core de alto desempenho e uma CPU NVIDIA Grace™ usando a interconexão NVLink-C2C às duas GPUs Blackwell.
Destaques
Inferência LLM e eficiência energética: TTL = 50 milissegundos (ms) em tempo real, FTL = 5s, 32.000 entradas/1.000 saídas, NVIDIA HGX™ H100 escalonado sobre InfiniBand (IB) vs. GB200 NVL72, treinamento 1,8T MOE HGX H100 escalonado sobre IB vs. GB200 NVL72 dimensionado sobre IB. Tamanho do cluster: 30.000
Consulta TPC-H 4: GB200 vs. Intel Xeon 8480+
Desempenho projetado sujeito a alterações.
O NVIDIA GB200 NVL4 desbloqueia o futuro do HPC e da IA convergentes, oferecendo desempenho revolucionário por meio de uma ponte conectando quatro GPUs NVIDIA NVLink Blackwell unificadas com duas CPUs Grace por meio da interconexão NVLink-C2C. Compatível com os servidores modulares NVIDIA MGX™ resfriados por líquido, ele fornece até o dobro de desempenho para computação científica, IA para treinamento científico e aplicações de inferência em relação à geração anterior.
Características
O NVIDIA Mission Control simplifica as operações de IA, desde cargas de trabalho até a infraestrutura, com experiência de nível mundial entregue como software. Ele impulsiona os data centers NVIDIA Grace Blackwell, trazendo agilidade instantânea para inferência e treinamento, além de fornecer inteligência full-stack para resiliência da infraestrutura. Com ele, qualquer empresa pode executar IA com eficiência de hiperescala, simplificando e acelerando sua experimentação com IA.
Especificações
| GB200 NVL72 | Superchip GB200 Grace Blackwell | |
| Configuração | 36 CPU Grace: GPUs 72 Blackwell | 1 CPU Grace: 2 GPUs Blackwell |
| Núcleo Tensor FP42 | 1.440 PFLOPS | 40 | 20 PFLOPS |
| Núcleo Tensor FP8/FP62 | 720 PFLOPS | 20 PFLOPS |
| Núcleo Tensor INT82 | 720 POPS | 20 POPS |
| FP16/BF16 Tensor Core2 | 360 PFLOPS | 10 PFLOPS |
| Núcleo Tensor TF322 | 180 PFLOPS | 5 PFLOPS |
| FP32 | 5.760 TFLOPS | 160 TFLOPS |
| Núcleo Tensor FP64/FP64 | 2880 TFLOPS | 80 TFLOPS |
| Memória de GPU | Largura de Banda | Até 13,4 TB HBM3e | 576 TB/s | Até 372 GB HBM3e | 16 TB/s |
| Largura de Banda NVLink | 130TB/s | 3,6TB/s |
| Contagem de Núcleos de CPU | 2.592 núcleos Arm® Neoverse V2 | 72 núcleos Arm Neoverse V2 |
| Memória de CPU | Largura de Banda | Até 17 TB LPDDR5X | Até 14 TB/s | Até 480GB LPDDR5X | Até 512 GB/s |
|
1. Especificação em esparso | denso. |
||
O NVIDIA GB300 NVL72 possui 40 vezes mais desempenho de inferência de IA do que as plataformas Hopper, 40 TB de memória rápida e integração de plataforma de rede com SuperNICs NVIDIA ConnectX®-8 usando Quantum-X800 InfiniBand ou Spectrum™-X Ethernet. O Blackwell Ultra proporciona um desempenho revolucionário nas workloads mais complexas, desde sistemas baseados em agentes e lógica até a geração de vídeo em tempo real 30 vezes mais rápida.