Ces technologies sont essentielles aux communications multi-GPU à haute vitesse et contribuent à accélérer l'intégration d'ensembles de données volumineux au sein des modèles d'IA et à optimiser les échanges de données entre les GPU.
L'accès à tout le potentiel de l'informatique exascale et des modèles d'IA à plusieurs billions de paramètres dépend d'une communication rapide et fluide entre tous les GPU d'un cluster de serveurs. La 5ᵉ génération de NVIDIA NVLink™ est une interconnexion évolutive qui booste le raisonnement de l'IA et accélère les performances des modèles d'inférence à plusieurs billions de paramètres.
NVLink de 5ᵉ génération améliore considérablement l'évolutivité des systèmes multi-GPU de grande taille en permettant aux GPU de partager leur mémoire et les calculs pour les workflows d'entraînement, d'inférence et de raisonnement. Un unique GPU NVIDIA Blackwell prend en charge jusqu'à 18 connexions NVLink à 100 giga-octets par seconde (Go/s), soit une bande passante totale de 1,8 téraoctet par seconde (To/s), c'est-à-dire deux fois plus que la génération précédente et plus de 14 fois plus qu'avec PCIe de 5ᵉ génération. Les plateformes de serveur telles que NVIDIA GB300 NVL72 tirent parti de cette technologie pour offrir une plus grande évolutivité pour les grands modèles les plus complexes d'aujourd'hui.
Une configuration NVLink avec NVIDIA GB300 permet de fournir une bande passante deux fois plus élevée pour les communications inter-GPU par rapport aux systèmes de génération précédente. Les chercheurs peuvent ainsi recourir à des applications plus sophistiquées et intensives pour résoudre des problèmes d’une grande complexité.
NVLink est une interconnexion bidirectionnelle GPU à GPU de 1,8 To/s qui augmente les entrées et les sorties (E/S) multi-GPU au sein d'un serveur. Les puces de commutation NVIDIA NVLink connectent plusieurs NVLinks pour fournir une communication GPU All-to-All à la vitesse NVLink maximale au sein d'un même rack et entre les racks.
Pour mettre en œuvre des opérations collectives à haute vitesse, chaque commutateur NVLink dispose de moteurs pour le protocole SHARP™ (Scalable Hierarchical Aggregation Reduction Protocol) de NVIDIA pour la réduction de la latence et l’accélération des multi-diffusions sur le réseau.
Grâce aux commutateurs NVSwitch, les connexions NVLink peuvent être étendues sur plusieurs nœuds afin de créer un cluster de GPU multi-nœuds à haute bande passante à la fois fluide et efficace, ce qui permet de former un GPU de la taille d’un Data Center. Le commutateur NVIDIA NVLink permet une bande passante GPU de 130 To/s dans un GPU GB300 NVL72 pour le parallélisme des grands modèles. Les clusters multi-serveurs avec NVLink font évoluer les communications des GPU tout en équilibrant avec l'accroissement du calcul, de sorte que NVL72 peut prendre en charge jusqu'à neuf fois plus de GPU qu'un seul système à huit GPU.
Le commutateur NVIDIA NVLink 5 dispose de 144 ports NVLink pour une capacité de commutation non bloquante de 14,4 To/s. Le commutateur de rack a été conçu pour fournir une bande passante élevée et une faible latence sur les systèmes NVIDIA GB300 NVL72 qui prennent en charge la connectivité NVLink externe de cinquième génération.
Le commutateur NVLink est la première puce de commutation au niveau du rack capable de prendre en charge jusqu'à 576 GPU entièrement connectés dans une fabric de calcul non bloquante. Le commutateur NVLink interconnecte toutes les paires de GPU à une vitesse incroyable de 1 800 Go/s. Il prend intégralement en charge les communications All-to-All. Les 72 GPU de la carte NVIDIA GB300 NVL72 peuvent être utilisés comme un seul accélérateur hautes performances offrant jusqu'à 1,4 exaFLOPS de puissance de calcul pour l'IA.
NVLink et le commutateur NVLink sont des composants clés de la solution de Data Center intégrale NVIDIA, qui comprend matériel, mise en réseau, logiciels, bibliothèques, ainsi que des modèles et des applications d'IA optimisés tirés de la suite logicielle NVIDIA AI Enterprise et du catalogue NVIDIA NGC™. Cette plateforme d'IA et de calcul intensif de bout en bout la plus puissante du marché permet aux chercheurs d'obtenir des résultats concrets et de déployer des solutions en production, pour une accélération sans précédent quelle que soit l'échelle.
Troisième génération | Quatrième génération | Cinquième génération | |
---|---|---|---|
Bande passante NVLink par GPU | 600 Go/s | 900 Go/s | 1800 Go/s |
Nombre maximal de liens par GPU | 12 | 18 | 18 |
Architectures NVIDIA compatibles | Architecture NVIDIA Ampere | Architecture NVIDIA Hopper™ | Architecture NVIDIA Blackwell |
Spécifications préliminaires susceptibles d’être modifiées.
Plongez au cœur de l’architecture NVIDIA Blackwell