Los componentes básicos de la comunicación de alta velocidad con múltiples GPU para introducir grandes conjuntos de datos más rápidamente en los modelos e intercambiarlos rápidamente entre las GPU.
Descubrir todo el potencial de la computación a exascala y de los modelos de IA con billones de parámetros depende de que haya una comunicación rápida y sin fisuras entre cada GPU ubicado en un clúster de servidores. La quinta generación de NVIDIA NVLink™ es una interconexión de escalabilidad que potencia exponencialmente el razonamiento de la IA y acelera el desempeño de modelos de inferencia que usan billones de parámetros.
El NVLink de quinta generación mejora enormemente la escalabilidad de los sistemas de múltiples GPU más grandes, ya que permite que las GPU compartan memoria y computaciones en los workflows de entrenamiento, inferencia y razonamiento. Una sola GPU NVIDIA Blackwell admite hasta 18 conexiones NVLink de 100 gigabytes por segundo (GB/s), lo que supone un ancho de banda total de 1.8 terabytes por segundo (TB/s), lo que supone 2 veces más ancho de banda que la generación anterior y más de 14 veces el ancho de banda de PCIe Gen5. Las plataformas de servidores como NVIDIA GB300 NVL72 aprovechan esta tecnología para ofrecer una mayor escalabilidad a los grandes modelos más complejos de la actualidad.
NVLink en NVIDIA H100 aumenta el ancho de banda de comunicación entre las GPU 1.5 veces en comparación con la generación anterior, lo que permite que los investigadores usen aplicaciones más grandes y sofisticadas para resolver problemas más complejos.
NVLink es una interconexión directa bidireccional de GPU a GPU de 1.8TB/s que escala la entrada y la salida (E/S) de varias GPU dentro de un servidor. El chip NVIDIA NVLink Switch conecta varios NVLink para proporcionar comunicación entre todas las GPU a la velocidad máxima de NVLink en un solo rack y entre racks.
A fin de permitir operaciones colectivas de alta velocidad, cada Switch NVLink tiene motores para el Protocolo de Reducción y Agregación Jerárquica Escalable de NVIDIA (SHARP)™ para lograr reducciones en la red y acelerar la multidifusión.
Con NVSwitch, las conexiones NVLink se pueden extender entre los nodos para crear un clúster de GPU con múltiples nodos con un alto ancho de banda y sin interrupciones, lo que crea una GPU del tamaño de un data center. El sistema de switch NVIDIA NVLink permite un ancho de banda de GPU de 130TB/s en un NVL72 para lograr el paralelismo de grandes modelos. Los clústeres de múltiples servidores con NVLink escalan las comunicaciones de GPU en equilibrio con el aumento de la computación, por lo que NVL72 puede admitir 9 veces el desempeño de GPU de un solo sistema de ocho GPU.
El switch NVIDIA NVLink cuenta con 144 puertos NVLink con una capacidad de switching sin bloqueo de 14.4 TB/s. El switch en rack está diseñado para proporcionar un gran ancho de banda y una baja latencia en los sistemas NVIDIA GB200 NVL72, que admiten dispositivos externos de conectividad NVLink de quinta generación.
El NVLink Switch es el primer chip de switching a nivel de rack capaz de admitir hasta 576 GPU completamente conectadas en una estructura informática sin bloqueo. El Switch NVLink interconecta cada par de GPU a la increíble velocidad de 1.800GB/s. Admite una comunicación total entre todos. Las 72 GPU del GB200 NVL72 pueden usarse como un único acelerador de alto desempeño con hasta 1.4 exaFLOPS de potencia en computación con IA.
NVLink y Switch NVLink son componentes esenciales de la solución completa para data centers de NVIDIA, que incluye hardware, redes, software, bibliotecas y modelos y aplicaciones de IA optimizados del paquete de software NVIDIA AI Enterprise y del catálogo NVIDIA NGC™. La plataforma de IA y HPC integral más potente permite a los investigadores ofrecer resultados del mundo real e implementar soluciones en la producción, lo que impulsa una aceleración sin precedentes a todos los niveles.
Segunda Generación | Tercera Generación | Cuarta Generación | |
---|---|---|---|
NVLink por GPU | 600GB/s | 900GB/s | 1,800GB/s |
Número Máximo de Enlaces por GPU | 12 | 18 | 18 |
Arquitecturas NVIDIA Compatibles | Arquitectura NVIDIA Ampere | Arquitectura NVIDIA Hopper™ | Arquitectura NVIDIA Blackwell |
Especificaciones preliminares; puede estar sujeto a cambios.
Explora a Fondo la Arquitectura NVIDIA Blackwell