Die Bausteine der High-Speed-Kommunikation mit mehreren Grafikkarten, um große Datensätze schneller in Modelle einzuspeisen und Daten zwischen Grafikkarten schnell auszutauschen.
Die Erschließung des vollen Potenzials von Exascale-Computing und KI-Modellen mit Billionen Parametern hängt von einer schnellen, nahtlosen Kommunikation zwischen allen Grafikprozessoren in einem Servercluster ab. Die fünfte Generation von NVIDIA NVLink™ ist eine Scale-up-Schnittstelle, die KI-Reasoning optimiert und die Leistung für Inferenzmodelle mit Billionen von Parametern beschleunigt.
NVLink der fünften Generation verbessert die Skalierbarkeit für größere Multi-GPU-Systeme erheblich, indem es GPUs ermöglicht wird, Speicher und Berechnungen für Trainings-, Inferenz- und Reasoning-Workflows gemeinsam zu nutzen. Eine einzige NVIDIA Blackwell GPU unterstützt bis zu 18 NVLink-Verbindungen mit 100 Gigabyte pro Sekunde (GB/s) bei einer Gesamtbandbreite von 1,8 Terabyte pro Sekunde (TB/s). Dies ist die 2-fache Bandbreite im Vergleich zur vorherigen Generation und mehr als die 14-fache Bandbreite gegenüber PCIe der 5. Generation. Serverplattformen wie NVIDIA GB300 NVL72 nutzen diese Technologie, um eine höhere Skalierbarkeit für die komplexesten großen Modelle von heute zu ermöglichen.
NVLink in NVIDIA GB300 erhöht die Bandbreite für die Kommunikation zwischen GPUs um das 2-Fache im Vergleich zur vorherigen Generation, sodass Forscher größere, anspruchsvollere Anwendungen für die Lösung komplexerer Probleme nutzen können.
NVLink ist eine bidirektionale, direkte GPU-zu-GPU-Verbindung mit 1,8 TB/s, die Multi-GPU-In- und -Output (IO) in einem Server skaliert. Die NVIDIA NVLink Switch-Chips verbinden mehrere NVLinks, um eine umfassende GPU-Kommunikation mit voller NVLink-Geschwindigkeit innerhalb eines einzigen Racks und zwischen den Racks zu ermöglichen.
Um einen kollektiven Hochgeschwindigkeitsbetrieb zu ermöglichen, verfügt jeder NVLink-Switch über Engines für NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ für netzwerkinterne Reduzierungen und Multicast-Beschleunigung
Mit NVLink Switch können NVLink-Verbindungen über Knoten hinweg ausgedehnt werden, um einen nahtlosen GPU-Cluster mit hoher Bandbreite zu bilden, der mehrere Knoten umfasst und eine effektive GPU für Rechenzentren bildet. NVIDIA NVLink Switch ermöglicht 130 TB/s GPU-Bandbreite in einem GB300-NVL72 für große Modellparallelität. Multi-Server-Cluster mit NVLink skalieren die GPU-Kommunikation im Gleichklang mit verbessertem Computing, sodass NVL72 die 9-fache Anzahl von GPUs unterstützen kann als ein einziges System mit acht GPUs.
Der NVIDIA NVLink 5 Switch verfügt über 144 NVLink-Ports mit einer nicht-blockierenden Switching-Kapazität von 14,4 TB/s. Der Rack-Switch ist für eine hohe Bandbreite und niedrige Latenz in NVIDIA GB300 NVL72-Systemen ausgelegt, die externe NVLink-Konnektivität der fünften Generation unterstützen.
Der NVLink Switch ist der erste Switch-Chip auf Rack-Ebene, der bis zu 576 vollständig verbundene GPUs in einer nicht blockierenden Rechenstruktur unterstützen kann. Der NVLink-Switch verbindet jedes GPU-Paar mit unglaublichen 1.800 GB/s. Er unterstützt eine vollständig allseitige Kommunikation. Die 72 GPUs in NVIDIA GB300 NVL72 können als ein einziger Hochleistungsbeschleuniger mit bis zu 1,4 exaFLOPS KI-Rechenleistung genutzt werden.
NVLink und NVLink Switch sind wichtige Bausteine der kompletten NVIDIA-Lösung für Rechenzentren, die Hardware, Netzwerke, Software, Bibliotheken und optimierte KI-Modelle und -Anwendungen aus der NVIDIA AI Enterprise-Softwaresuite und dem NVIDIA NGC™-Katalog umfasst. Die extrem leistungsstarke End-to-End-Plattform für KI und HPC ermöglicht es Forschern, konkrete Ergebnisse zu liefern sowie Lösungen für die Produktion bereitzustellen und bietet bei jeder Größenordnung eine beispiellose Beschleunigung.
Dritte Generation | Vierte Generation | Fünfte Generation | |
---|---|---|---|
NVLink-Bandbreite pro GPU | 600 GB/s | 900 GB/s | 1,800 GB/s |
Maximale Anzahl an Links pro Grafikkarte | 12 | 18 | 18 |
Unterstützte NVIDIA-Architekturen | NVIDIA Ampere-Architektur | NVIDIA™ Hopper-Architektur | NVIDIA Blackwell-Architektur |
Vorläufige Spezifikationen, Änderungen möglich
Tiefer Einblick in die NVIDIA Blackwell-Architektur