Impulsando la nueva era de la IA generativa.
GB200 NVL72 conecta 36 CPU Grace y 72 GPU Blackwell en un diseño a escala de bastidor con refrigeración líquida. Cuenta con un dominio NVLink de 72 GPU que actúa como una sola GPU enorme y ofrece una inferencia de grandes modelos de lenguaje (LLM) de billones de parámetros 30 veces más rápida.
El Superchip GB200 Grace Blackwell es un componente clave de NVIDIA GB200 NVL72, que conecta dos GPU NVIDIA Blackwell Tensor Core de alto desempeño y una CPU NVIDIA Grace™ mediante la interconexión NVIDIA NVLink™-C2C a las dos GPU Blackwell.
Destacados
Inferencia LLM y eficiencia energética: TTL = 50 milisegundos (ms) en tiempo real, FTL = 5000 ms, 32 000 entradas/1000 salidas, NVIDIA HGX™ H100 ampliado sobre InfiniBand (IB) frente a GB200 NVL72, entrenamiento de 1,8 T MOE HGX H100 ampliado IB frente a GB200 NVL72 escalado sobre IB.
Tamaño del grupo: 30.000
Consulta 4 de TPC-H: GB200 frente a Intel Xeon 8480+
Rendimiento proyectado sujeto a cambios.
Características
NVIDIA GB300 NVL72 cuenta con 40 veces más desempeño de inferencia de IA que las plataformas Hopper, 40TB de memoria rápida y la integración de la plataforma de red con SuperNIC NVIDIA ConnectX®-8, que usa Quantum-X800 InfiniBand o Spectrum™-X Ethernet. Blackwell Ultra ofrece un desempeño innovador en las cargas de trabajo más complejas, desde razonamiento y sistemas basados en agente hasta la generación de videos en tiempo real 30 veces más rápido.
Especificaciones
GB200 NVL72 | Superchip GB200 Grace Blackwell | |
Configuração | 36 CPU Grace: 72 GPU Blackwell | 1 CPU Grace: 2 GPU Blackwell |
FP4 Tensor Core1 | 1.440 PFLOPS | 40 PFLOPS |
Núcleo Tensor FP8/FP621 | 720 PFLOPS | 20 PFLOPS |
Núcleo Tensor INT81 | 720 POPS | 20 POPS |
FP16/BF16 Tensor Core1 | 360 PFLOPS | 10 PFLOPS |
TF32 Tensor Core | 180 PFLOPS | 5 PFLOPS |
FP32 | 5,760 TFLOPS | 160 TFLOPS |
FP64 | 2,880 TFLOPS | 80 TFLOPS |
Núcleo Tensor FP64 | 2,880 TFLOPS | 80 TFLOPS |
Memoria de GPU | Ancho de Banda | Hasta 13,4TB HBM3e | 576TB/s | Hasta 372 GB HBM3e | 16TB/s |
Ancho de Banda NVLink | 130TB/s | 3.6TB/s |
Recuento de Núcleos de CPU | 2.592 Arm® Neoverse V2 cores | 72 Arm Neoverse V2 cores |
Memoria de CPU | Ancho de Banda | Hasta 17TB LPDDR5X | Hasta 18.4TB/s | Hasta 480GB LPDDR5X | Hasta 512 GB/s |
1. Con escasez |