NVLink Switch Chip

NVIDIA NVLink e NVLink Switch

Scale-up networking fabric with high-bandwidth GPU-to-GPU communications for AI training, inference, and other demanding rack-scale GPU-accelerated workloads.

La necessità di un'interconnessione scalabile ancora più veloce

Per ottenere le massime prestazioni per gli ultimi modelli IA sono necessarie comunicazioni da GPU a GPU fluide e ad alto throughput nell'intero rack server. Con una bassa latenza, un'enorme larghezza di banda di rete e la connettività all-to-all, le tecnologie NVIDIA NVLink™ di sesta generazione e NVLink Switch sono progettate per accelerare l'addestramento e l'inferenza per carichi di lavoro di ragionamento e IA agentica.

Prestazioni di NVLink su larga scala

La tecnologia NVIDIA NVLink di sesta generazione su NVIDIA Rubin raddoppia la larghezza di banda di comunicazione da GPU a GPU rispetto alla generazione precedente, per un addestramento e un'inferenza più rapidi con le ultime architetture dei modelli IA.

Aumenta il throughput di ragionamento con NVLink Communications

Collega le GPU con NVIDIA NVLink e NVLink Switch

L'interconnessione bidirezionale e diretta da GPU a GPU da 3,6 TB/s NVLink scala l'input e l'output (IO) multi-GPU all'interno dei server. I chip NVIDIA NVLink Switch connettono più NVLink per fornire una comunicazione GPU completa, alla massima velocità NVLink, nell'intero rack. 

Per consentire operazioni collettive ad alta velocità, ogni switch NVLink dispone di motori per il protocollo NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ per la riduzione delle emissioni nella rete e l'accelerazione multicast.  

Accelera il ragionamento durante il test per modelli di trilioni di parametri con il sistema NVLink Switch

Con NVLink Switch, le connessioni NVLink possono essere estese su più nodi per creare un cluster GPU fluido, a elevata larghezza di banda e multi-nodo, formando efficacemente una GPU di dimensioni data center. Lo switch NVIDIA NVLink consente di ottenere 260 TB/s di larghezza di banda GPU in un solo NVIDIA Vera Rubin NVL72 per il parallelismo di modelli di grandi dimensioni. I cluster multi-server con NVLink scalano le comunicazioni delle GPU in equilibrio grazie alla maggiore capacità di calcolo, consentendo così a NVIDIA Vera Rubin NVL72 di supportare un numero di GPU 9 volte superiore rispetto a un singolo sistema a otto GPU.


Scalabilità da enterprise a esascala

Connessione piena per prestazioni senza pari

Il chip NVLink Switch su Vera Rubin NVL72 consente di utilizzare 72 GPU completamente connesse in un fabric di calcolo non bloccante. Lo switch NVLink interconnette ogni coppia di GPU a una velocità incredibile di 3,6 TB/s. Supporta la comunicazione all-to-all completa.   Le 72 GPU su Vera Rubin NVL72 possono essere usate come un singolo acceleratore ad alte prestazioni con fino a 3,6 exaFLOPS di potenza di calcolo IA. 

La piattaforma per IA e HPC più potente.

NVLink e NVLink Switch sono fondamenti essenziali della soluzione completa per data center NVIDIA che integra hardware, rete, software, librerie, modelli e applicazioni IA ottimizzati dalla suite software NVIDIA AI Enterprise e dal catalogo NVIDIA NGC™. Piattaforma IA e HPC completa più potente, consente ai ricercatori di fornire risultati in tempo reale e distribuire soluzioni nell'ambiente di produzione in modo scalabile, generando un'accelerazione senza precedenti su ogni ordine di grandezza.

Scopri tutto sulla piattaforma NVIDIA Rubin.