Pour exploiter le plein potentiel du calcul Exascale et de nouveaux modèles d’IA pouvant inclure plusieurs billions de paramètres, il convient de mettre en œuvre des communications fluides et rapides entre chaque GPU au sein d’un cluster de serveurs. La technologie NVIDIA® NVLink® de 5e génération repose sur un modèle évolutif qui permet d'interconnecter jusqu'à 576 GPU pour accélérer les performances des modèles d’IA incluant des billions de paramètres (voire beaucoup plus).
La puce de commutation NVIDIA NVLink, qui fournit une bande passante de 130 To/s au sein d'un domaine NVLink à 72 GPU (NVL72), apporte une efficacité de bande passante 4 fois plus importante grâce à la prise en charge du protocole SHARP™ (NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol) avec le format FP8. La puce de commutation NVIDIA NVLink peut prendre en charge des clusters allant au-delà d’un seul serveur, tout en maintenant un impressionnant débit d’interconnexion s'élevant à 1,8 To/s. Les clusters multiserveurs avec NVLink permettent de mettre à niveau les communications GPU en les équilibrant avec l'augmentation de la puissance de calcul. Chaque domaine NVL72 peut ainsi fournir un rendement 9 fois plus élevé qu’avec un seul système à huit GPU.