NVLink-Switch-Chip

NVLink und NVLink-Switch

Die Bausteine der High-Speed-Kommunikation mit mehreren Grafikkarten, um große Datensätze schneller in Modelle einzuspeisen und Daten zwischen Grafikkarten schnell auszutauschen.

Bedarf an schnelleren skalierbaren Verbindungen

Die Erschließung des vollen Potenzials von Exascale-Computing und KI-Modellen mit Billionen Parametern hängt von einer schnellen, nahtlosen Kommunikation zwischen allen Grafikprozessoren in einem Servercluster ab. Die fünfte Generation von NVIDIA NVLink™ ist eine Scale-up-Schnittstelle, die KI-Reasoning optimiert und die Leistung für Inferenzmodelle mit Billionen von Parametern beschleunigt.

NVLink At-Scale-Leistung

NVLink der fünften Generation

NVLink in NVIDIA GB300 erhöht die Bandbreite für die Kommunikation zwischen GPUs um das 2-Fache im Vergleich zur vorherigen Generation, sodass Forscher größere, anspruchsvollere Anwendungen für die Lösung komplexerer Probleme nutzen können.

Höherer Reasoning-Durchsatz mit NVLink-Kommunikation

NVLink-Switch-Chip

Vollständig verbundene Grafikkarten mit NVIDIA NVLink und NVLink-Switch

NVLink ist eine bidirektionale, direkte GPU-zu-GPU-Verbindung mit 1,8 TB/s, die Multi-GPU-In- und -Output (IO) in einem Server skaliert. Die NVIDIA NVLink Switch-Chips verbinden mehrere NVLinks, um eine umfassende GPU-Kommunikation mit voller NVLink-Geschwindigkeit innerhalb eines einzigen Racks und zwischen den Racks zu ermöglichen.

Um einen kollektiven Hochgeschwindigkeitsbetrieb zu ermöglichen, verfügt jeder NVLink-Switch über Engines für NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ für netzwerkinterne Reduzierungen und Multicast-Beschleunigung

GB300 NVL72 Rack

Beschleunigen Sie das Testzeit-Reasoning für Billionen von Parametermodellen mit dem NVLink-Switch-System

Mit NVLink Switch können NVLink-Verbindungen über Knoten hinweg ausgedehnt werden, um einen nahtlosen GPU-Cluster mit hoher Bandbreite zu bilden, der mehrere Knoten umfasst und eine effektive GPU für Rechenzentren bildet. NVIDIA NVLink Switch ermöglicht 130 TB/s GPU-Bandbreite in einem GB300-NVL72 für große Modellparallelität. Multi-Server-Cluster mit NVLink skalieren die GPU-Kommunikation im Gleichklang mit verbessertem Computing, sodass NVL72 die 9-fache Anzahl von GPUs unterstützen kann als ein einziges System mit acht GPUs.

GB300 NVL72 Rack
NVLink-Switch-Tray

NVIDIA NVLink-Switch

Der NVIDIA NVLink 5 Switch verfügt über 144 NVLink-Ports mit einer nicht-blockierenden Switching-Kapazität von 14,4 TB/s. Der Rack-Switch ist für eine hohe Bandbreite und niedrige Latenz in NVIDIA GB300 NVL72-Systemen ausgelegt, die externe NVLink-Konnektivität der fünften Generation unterstützen.


Skalierung von Enterprise auf Exascale

Vollständige Verbindung für unübertroffene Leistung

Der NVLink Switch ist der erste Switch-Chip auf Rack-Ebene, der bis zu 576 vollständig verbundene GPUs in einer nicht blockierenden Rechenstruktur unterstützen kann. Der NVLink-Switch verbindet jedes GPU-Paar mit unglaublichen 1.800 GB/s. Er unterstützt eine vollständig allseitige Kommunikation. Die 72 GPUs in NVIDIA GB300 NVL72 können als ein einziger Hochleistungsbeschleuniger mit bis zu 1,4 exaFLOPS KI-Rechenleistung genutzt werden.

Die leistungsstärkste AI- und HPC-Plattform

NVLink und NVLink Switch sind wichtige Bausteine der kompletten NVIDIA-Lösung für Rechenzentren, die Hardware, Netzwerke, Software, Bibliotheken und optimierte KI-Modelle und -Anwendungen aus der NVIDIA AI Enterprise-Softwaresuite und dem NVIDIA NGC™-Katalog umfasst. Die extrem leistungsstarke End-to-End-Plattform für KI und HPC ermöglicht es Forschern, konkrete Ergebnisse zu liefern sowie Lösungen für die Produktion bereitzustellen und bietet bei jeder Größenordnung eine beispiellose Beschleunigung.

Tiefer Einblick in die NVIDIA Blackwell-Architektur

Select Location
Middle East