NVIDIA GB200 NVL72

La nuova era del computing.

Introduzione
In evidenza
Caratteristiche
Specifiche

Introduzione

Introduzione
In evidenza
Caratteristiche
Specifiche

Sbloccare modelli con miliardi di parametri in tempo reale

GGB200 NVL72 collega 36 CPU Grace e 72 GPU Blackwell in un design rack-scale e raffreddato a liquido. Vanta un dominio NVLink da 72 GPU che funge da singola GPU di grandi dimensioni e offre un'inferenza LLM in tempo reale da trilioni di parametri 30 volte più veloce.

Il Superchip GB200 Grace Blackwell è un componente chiave di NVIDIA GB200 NVL72, che collega due GPU NVIDIA Blackwell Tensor Core ad alte prestazioni e una CPU NVIDIA Grace™ utilizzando l'interconnessione NVIDIA NVLink™-C2C alle due GPU Blackwell.

L'architettura Blackwell Rack-Scale per inferenza e training con miliardi di parametri in tempo reale

NVIDIA GB200 NVL72 è un computer exascale in un singolo rack. Con 36 GB200 interconnessi dal più grande dominio NVIDIA® NVLink® mai offerto, il sistema NVLink Switch offre 130 terabyte al secondo (TB/s) di comunicazioni GPU a bassa latenza per carichi di lavoro IA e HPC.

Blog tecnico

In evidenza

La super potenza dell'IA di nuova generazione e del computing accelerato

Inferenza con LLM

30X rispetto alla GPU NVIDIA H100 Tensor Core

Training di LLM

4X rispetto alla H100

Efficienza energetica

25X rispetto alla H100

Elaborazione dati

18X rispetto alla CPU

Inferenza ed efficienza energetica LLM: TTL = 50 millisecondi (ms) in tempo reale, FTL = 5 s, 32.768 input/1.024 output, NVIDIA HGX™ H100 in scala su InfiniBand (IB) rispetto a GB200 NVL72, training di 1,8 T MOE 4096x HGX H100 in scala su IB rispetto a 456 x GB200 NVL72 in scala su IB. Dimensioni cluster: 32.768
Carico di lavoro di aggregazione e unione nel database con compressione Snappy/Deflate derivata da query TPC-H Q4. Implementazione di query personalizzate per x86, H100 singola GPU e singola GPU da GB200 NLV72 rispetto a Intel Xeon 8480+
Prestazioni previste soggette a modifica.

Inferenza LLM in tempo reale

GB200 NVL72 introduce funzionalità all'avanguardia e un Transformer Engine di seconda generazione, che consente l'IA FP4. Se abbinata a NVIDIA NVLink di quinta generazione, offre prestazioni di inferenza LLM in tempo reale 30 volte più veloci per modelli linguistici da trilioni di parametri. Questo progresso è reso possibile da una nuova generazione di Tensor Core che introducono nuovi formati di microscaling, offrendo alta precisione e maggiore throughput. Inoltre, GB200 NVL72 utilizza NVLink e il raffreddamento a liquido per creare un singolo rack da 72 GPU di grandi dimensioni in grado di superare i colli di bottiglia della comunicazione.

Addestramento su larga scala

GB200 NVL72 include un Transformer Engine di seconda generazione più veloce, con la precisione FP8, che consente uno straordinario addestramento 4 volte più rapido e su larga scala per modelli linguistici di grandi dimensioni. Questa innovazione è integrata da NVLink di quinta generazione, che fornisce 1,8 TB/s di interconnessione da GPU a GPU, networking InfiniBand e il software NVIDIA Magnum IO™.

Infrastruttura a risparmio energetico

I rack GB200 NVL72 raffreddati a liquido riducono l'impronta di carbonio e il consumo di energia di un data center. Il raffreddamento a liquido aumenta la densità di calcolo, riduce la quantità di spazio utilizzato e facilita la comunicazione GPU ad alta larghezza di banda e bassa latenza con le architetture di dominio NVLink di grandi dimensioni. Rispetto all'infrastruttura raffreddata ad aria NVIDIA H100, GB200 offre 25 volte più prestazioni alla stessa potenza, riducendo al contempo il consumo di acqua.

Grafico delle prestazioni di elaborazione dati

Elaborazione dei dati

I database, ricoprono ruoli critici nella gestione, nell'elaborazione e nell'analisi di grandi volumi di dati per le imprese. GB200 sfrutta l'alta larghezza di banda NVLink-C2C e i motori di decompressione dedicati dell'architettura NVIDIA Blackwell per accelerare le principali query del database di 18 volte rispetto alla CPU e fornire un TCO 5 volte superiore.

Caratteristiche

Innovazioni tecnologiche

Architettura Blackwell

L'architettura NVIDIA Blackwell offre progressi all'avanguardia nel computing accelerato, definendo la nuova era dell'IA generativa con prestazioni, efficienza e scalabilità senza pari.

Scopri di più

CPU NVIDIA Grace

Il superchip NVIDIA Grace CPU è un processore all'avanguardia progettato per i data center moderni che eseguono applicazioni IA, cloud e HPC. Offre prestazioni e larghezza di banda di memoria eccezionali con un'efficienza energetica 2 volte superiore rispetto ai principali processori server di oggi.

Scopri di più

NVIDIA NVLink di quinta generazione

Per sfruttare appieno il potenziale del calcolo exascale e dei modelli IA da trilioni di parametri, è necessaria una comunicazione rapida e fluida tra ogni GPU in un cluster di server. La quinta generazione di NVLink è un'interconnessione scalabile che offre prestazioni accelerate per modelli IA da trilioni e multi-trilioni di parametri.

Scopri di più su NVLink e NVLink Switch

NVIDIA Networking

La rete del data center svolge un ruolo cruciale nel guidare i progressi e le prestazioni dell'IA, fungendo da spina dorsale per l'addestramento dei modelli IA distribuiti e le prestazioni di IA generativa. NVIDIA Quantum-X800 InfiniBand, NVIDIA Spectrum™-X800 Ethernet e le DPU NVIDIA® BlueField®-3 consentono la scalabilità efficiente su centinaia e migliaia di GPU Blackwell per prestazioni ottimali delle applicazioni.

Scopri le soluzioni di networking complete

Fabbrica IA per la nuova rivoluzione industriale

NVIDIA GB300 NVL72

NVIDIA GB300 NVL72 offre prestazioni di inferenza IA 40 volte superiori rispetto alle piattaforme Hopper, 40 TB di memoria veloce e l'integrazione della piattaforma di networking con NVIDIA ConnectX®-8 SuperNIC che utilizzano Quantum-X800 InfiniBand o Spectrum™-X Ethernet. Blackwell Ultra offre prestazioni rivoluzionarie sui carichi di lavoro più complessi, dai sistemi per agenti e il ragionamento alla generazione di video in tempo reale 30 volte più veloce.

Scopri di più

NVIDIA GB200 Grace Blackwell NVL4 Superchip

Specifiche

Specifiche di GB200 NVL72

	GB200 NVL72	Superchip Grace Blackwell GB200
Configurazioni	36 CPU Grace: 72 GPU Blackwell	1 CPU Grace: 2 GPU Blackwell
FP4 Tensor Core¹	1.440 PFLOPS	40 PFLOPS
FP8/FP6 Tensor Core¹	720 PFLOPS	20 PFLOPS
INT8 Tensor Core¹	720 POPS	20 POPS
FP16/BF16 Tensor Core¹	360 PFLOPS	10 PFLOPS
TF32 Tensor Core	180 PFLOPS	5 PFLOPS
FP32	5.760 TFLOPS	160 TFLOPS
FP64	2.880 TFLOPS	80 TFLOPS
FP64 Tensor Core	2.880 TFLOPS	80 TFLOPS
Memoria della GPU \| Larghezza di banda	Fino a 13,4 TB HBM3e \| 576 TB/s	Fino a 372 GB HBM3e \| 16 TB/s
Banda NVLink	130 TB/s	3,6 TB/s
Numero di core CPU	2.592 Core Arm® Neoverse V2	72 Core Arm Neoverse V2
Memoria della CPU \| Larghezza di banda	Fino a 17 TB LPDDR5X \| Fino a 18,4 TB/s	Fino a 480 GB \| Fino a 512 GB/s
1. Con densità.

Inizia

Resta aggiornato

Iscriviti per sapere quando NVIDIA Blackwell sarà disponibile.

Avvisami