NVIDIA Grace Blackwell GB200

NVIDIA GB200 NVL72

Impulsando la nueva era de la IA generativa.

Desbloqueo de Modelos de Billones de Parámetros en Tiempo Real

GB200 NVL72 conecta 36 CPU Grace y 72 GPU Blackwell en un diseño a escala de bastidor con refrigeración líquida. Cuenta con un dominio NVLink de 72 GPU que actúa como una sola GPU enorme y ofrece una inferencia de grandes modelos de lenguaje (LLM) de billones de parámetros 30 veces más rápida.

El Superchip GB200 Grace Blackwell es un componente clave de NVIDIA GB200 NVL72, que conecta dos GPU NVIDIA Blackwell Tensor Core de alto desempeño y una CPU NVIDIA Grace™ mediante la interconexión NVIDIA NVLink™-C2C a las dos GPU Blackwell.

La Arquitectura de Escala de Rack de Blackwell para la Inferencia y el Entrenamiento de Billones de Parámetros en Tiempo Real

El NVIDIA GB200 NVL72 es una computadora a exaescala en un solo rack. Con 36 GB200 interconectados por el dominio NVIDIA® NVLink® más grande jamás ofrecido, el Sistema de Switch NVLink proporciona 130 terabytes por segundo (TB/s) de comunicaciones GPU de baja latencia para cargas de trabajo de IA y computación de alto rendimiento (HPC).

Destacados

Potenciando la IA de Próxima Generación y la Computación Acelerada

Inferencia LLM

30X

Entrenamiento LLM

4X

Eficiencia Energética

25X

Procesamiento de Datos

18X

Inferencia LLM y eficiencia energética: TTL = 50 milisegundos (ms) en tiempo real, FTL = 5000 ms, 32 000 entradas/1000 salidas, NVIDIA HGX™ H100 ampliado sobre InfiniBand (IB) frente a GB200 NVL72, entrenamiento de 1,8 T MOE HGX H100 ampliado IB frente a GB200 NVL72 escalado sobre IB.
Tamaño del grupo: 30.000
Consulta 4 de TPC-H: GB200 frente a Intel Xeon 8480+
Rendimiento proyectado sujeto a cambios.

Gráfico de Desempeño de Inferencia de LLM en Tiempo Real

Inferencia de LLM en Tiempo Real

GB200 NVL72 presenta capacidades de vanguardia y un Motor Transformer de segunda generación, que habilita la IA FP4. Cuando se combina con NVIDIA NVLink de quinta generación, ofrece un desempeño de inferencia de LLM en tiempo real 30 veces más rápido para modelos de lenguaje con billones de parámetros. Este avance es posible con una nueva generación de Núcleos Tensor, que introducen nuevos formatos de microescala, lo que brinda una alta precisión y un mayor procesamiento. Además, GB200 NVL72 usa NVLink y la refrigeración líquida para crear un solo bastidor enorme de 72 GPU que puede superar los cuellos de botella de comunicación.

Gráfico de Desempeño de Entrenamiento a Escala Masiva

Entrenamiento a Escala Masiva

GB200 NVL72 incluye un Motor Transformer de segunda generación más rápido, con precisión FP8, lo que permite un notable entrenamiento con 4 veces más velocidad para grandes modelos de lenguaje a escala. Este avance se complementa con NVLink de quinta generación, que proporciona 1.8TB/s de interconexión de GPU a GPU, redes InfiniBand y el software NVIDIA Magnum IO™.

Gráfico de desempeño de Infraestructura con Eficiencia Energética

Infraestructura con Eficiencia Energética

Los bastidores GB200 NVL72 con refrigeración líquida reducen la huella de carbono y el consumo de energía de un data center. La refrigeración líquida aumenta la densidad de computación, reduce la cantidad de espacio utilizado y facilita la comunicación de la GPU de alto ancho de banda y baja latencia con grandes arquitecturas de dominio NVLink. En comparación con la infraestructura con refrigeración por aire NVIDIA H100, GB200 ofrece 25 veces más desempeño con la misma alimentación, a la vez que reduce el consumo de agua.

Gráfico de Desempeño de Procesamiento de Datos

Procesamiento de Datos

Las bases de datos desempeñan funciones fundamentales en el manejo, procesamiento y análisis de grandes volúmenes de datos para las empresas. GB200 aprovecha el rendimiento de la memoria de gran ancho de banda, NVLink-C2C y los motores de descompresión dedicados en la arquitectura NVIDIA Blackwell para acelerar 18 veces las consultas clave de bases de datos en comparación con la CPU y ofrecer un costo total de propiedad 5 veces mejor.

Características

Avances Tecnológicos

Blackwell Architecture AI Icon

Arquitectura Blackwell

La arquitectura NVIDIA Blackwell ofrece avances innovadores en computación acelerada, definiendo la nueva era de la computación con rendimiento, eficiencia y escala incomparables.

Grace CPU Icon

CPU NVIDIA Grace

El Superchip de CPU NVIDIA Grace es un procesador innovador diseñado para data centers modernos que ejecutan aplicaciones de inteligencia artificial, nube y computación de alto rendimiento (HPC). Proporciona un rendimiento excepcional y un ancho de banda de memoria con el doble de eficiencia energética que los procesadores de servidor líderes en la actualidad.

NVSwitch Icon

NVIDIA NVLink de Quinta Generación

Descubrir todo el potencial de la computación a exascala y de los modelos de IA con billones de parámetros depende de que haya una comunicación rápida y sin fisuras entre cada GPU ubicada en un clúster de servidores. La quinta generación de NVLink es una interconexión de escalabilidad que activa un desempeño acelerado para modelos de IA de billones y varios billones de parámetros.

NVIDIA Networking DPU Icon

Redes NVIDIA

La red del data center desempeña un papel crucial para impulsar los avances y el desempeño de la IA, y sirve como la columna vertebral para el entrenamiento de modelos de IA distribuida y el desempeño de la IA generativa.  NVIDIA Quantum-X800 InfiniBand, NVIDIA Spectrum™-X800 Ethernet y la DPU NVIDIA® BlueField®-3 habilitan una escalabilidad eficiente en cientos y miles de GPU Blackwell, para lograr un desempeño óptimo de las aplicaciones.

NVIDIA GB300 NVL72

NVIDIA GB300 NVL72 cuenta con 40 veces más desempeño de inferencia de IA que las plataformas Hopper, 40TB de memoria rápida y la integración de la plataforma de red con SuperNIC NVIDIA ConnectX®-8, que usa Quantum-X800 InfiniBand o Spectrum™-X Ethernet. Blackwell Ultra ofrece un desempeño innovador en las cargas de trabajo más complejas, desde razonamiento y sistemas basados en agente hasta la generación de videos en tiempo real 30 veces más rápido.

NVIDIA GB300 NVL72

Especificaciones

Especificaciones de GB200 NVL72

  GB200 NVL72 Superchip GB200 Grace Blackwell
Configuração 36 CPU Grace: 72 GPU Blackwell 1 CPU Grace: 2 GPU Blackwell
FP4 Tensor Core1 1.440 PFLOPS 40 PFLOPS
Núcleo Tensor FP8/FP621 720 PFLOPS 20 PFLOPS
Núcleo Tensor INT81 720 POPS 20 POPS
FP16/BF16 Tensor Core1 360 PFLOPS 10 PFLOPS
TF32 Tensor Core 180 PFLOPS 5 PFLOPS
FP32 5,760 TFLOPS 160 TFLOPS
FP64 2,880 TFLOPS 80 TFLOPS
Núcleo Tensor FP64 2,880 TFLOPS 80 TFLOPS
Memoria de GPU | Ancho de Banda Hasta 13,4TB HBM3e | 576TB/s Hasta 372 GB HBM3e | 16TB/s
Ancho de Banda NVLink 130TB/s 3.6TB/s
Recuento de Núcleos de CPU 2.592 Arm® Neoverse V2 cores 72 Arm Neoverse V2 cores
Memoria de CPU | Ancho de Banda Hasta 17TB LPDDR5X | Hasta 18.4TB/s Hasta 480GB LPDDR5X | Hasta 512 GB/s

Empezar

Estar al Día

Regístrese para saber cuándo NVIDIA Blackwell estará disponible.

Select Location
Middle East