NVIDIA Grace Blackwell GB200

NVIDIA GB200 NVL72

La nuova era del computing.

Sbloccare modelli con miliardi di parametri in tempo reale

GGB200 NVL72 collega 36 CPU Grace e 72 GPU Blackwell in un design rack-scale e raffreddato a liquido. Vanta un dominio NVLink da 72 GPU che funge da singola GPU di grandi dimensioni e offre un'inferenza LLM in tempo reale da trilioni di parametri 30 volte più veloce.

Il Superchip GB200 Grace Blackwell è un componente chiave di NVIDIA GB200 NVL72, che collega due GPU NVIDIA Blackwell Tensor Core ad alte prestazioni e una CPU NVIDIA Grace™ utilizzando l'interconnessione NVIDIA NVLink™-C2C alle due GPU Blackwell.

L'architettura Blackwell Rack-Scale per inferenza e training con miliardi di parametri in tempo reale

NVIDIA GB200 NVL72 è un computer exascale in un singolo rack. Con 36 GB200 interconnessi dal più grande dominio NVIDIA® NVLink® mai offerto, il sistema NVLink Switch offre 130 terabyte al secondo (TB/s) di comunicazioni GPU a bassa latenza per carichi di lavoro IA e HPC.

In evidenza

La super potenza dell'IA di nuova generazione e del computing accelerato

Inferenza con LLM

30X

Training di LLM

4X

Efficienza energetica

25X

Elaborazione dati

18X

Inferenza ed efficienza energetica LLM: TTL = 50 millisecondi (ms) in tempo reale, FTL = 5 s, 32.768 input/1.024 output, NVIDIA HGX™ H100 in scala su InfiniBand (IB) rispetto a GB200 NVL72, training di 1,8 T MOE 4096x HGX H100 in scala su IB rispetto a 456 x GB200 NVL72 in scala su IB. Dimensioni cluster: 32.768
Carico di lavoro di aggregazione e unione nel database con compressione Snappy/Deflate derivata da query TPC-H Q4. Implementazione di query personalizzate per x86, H100 singola GPU e singola GPU da GB200 NLV72 rispetto a Intel Xeon 8480+
Prestazioni previste soggette a modifica.

Grafico delle prestazioni di inferenza LLM in tempo reale

Inferenza LLM in tempo reale

GB200 NVL72 introduce funzionalità all'avanguardia e un Transformer Engine di seconda generazione, che consente l'IA FP4. Se abbinata a NVIDIA NVLink di quinta generazione, offre prestazioni di inferenza LLM in tempo reale 30 volte più veloci per modelli linguistici da trilioni di parametri. Questo progresso è reso possibile da una nuova generazione di Tensor Core che introducono nuovi formati di microscaling, offrendo alta precisione e maggiore throughput. Inoltre, GB200 NVL72 utilizza NVLink e il raffreddamento a liquido per creare un singolo rack da 72 GPU di grandi dimensioni in grado di superare i colli di bottiglia della comunicazione.

Grafico delle prestazioni di addestramento su larga scala

Addestramento su larga scala

GB200 NVL72 include un Transformer Engine di seconda generazione più veloce, con la precisione FP8, che consente uno straordinario addestramento 4 volte più rapido e su larga scala per modelli linguistici di grandi dimensioni. Questa innovazione è integrata da NVLink di quinta generazione, che fornisce 1,8 TB/s di interconnessione da GPU a GPU, networking InfiniBand e il software NVIDIA Magnum IO™.

Grafico delle prestazioni dell'infrastruttura a risparmio energetico

Infrastruttura a risparmio energetico

I rack GB200 NVL72 raffreddati a liquido riducono l'impronta di carbonio e il consumo di energia di un data center. Il raffreddamento a liquido aumenta la densità di calcolo, riduce la quantità di spazio utilizzato e facilita la comunicazione GPU ad alta larghezza di banda e bassa latenza con le architetture di dominio NVLink di grandi dimensioni. Rispetto all'infrastruttura raffreddata ad aria NVIDIA H100, GB200 offre 25 volte più prestazioni alla stessa potenza, riducendo al contempo il consumo di acqua.

Grafico delle prestazioni di elaborazione dati

Elaborazione dei dati

I database, ricoprono ruoli critici nella gestione, nell'elaborazione e nell'analisi di grandi volumi di dati per le imprese. GB200 sfrutta l'alta larghezza di banda NVLink-C2C e i motori di decompressione dedicati dell'architettura NVIDIA Blackwell per accelerare le principali query del database di 18 volte rispetto alla CPU e fornire un TCO 5 volte superiore.

Caratteristiche

Innovazioni tecnologiche

Icona dell'architettura Blackwell IA

Architettura Blackwell

L'architettura NVIDIA Blackwell offre progressi all'avanguardia nel computing accelerato, definendo la nuova era dell'IA generativa con prestazioni, efficienza e scalabilità senza pari.

Icona di CPU Grace

CPU NVIDIA Grace

Il superchip NVIDIA Grace CPU è un processore all'avanguardia progettato per i data center moderni che eseguono applicazioni IA, cloud e HPC. Offre prestazioni e larghezza di banda di memoria eccezionali con un'efficienza energetica 2 volte superiore rispetto ai principali processori server di oggi.

NVSwitch Icon

NVIDIA NVLink di quinta generazione

Per sfruttare appieno il potenziale del calcolo exascale e dei modelli IA da trilioni di parametri, è necessaria una comunicazione rapida e fluida tra ogni GPU in un cluster di server. La quinta generazione di NVLink è un'interconnessione scalabile che offre prestazioni accelerate per modelli IA da trilioni e multi-trilioni di parametri.

NVIDIA Networking DPU Icon

NVIDIA Networking

La rete del data center svolge un ruolo cruciale nel guidare i progressi e le prestazioni dell'IA, fungendo da spina dorsale per l'addestramento dei modelli IA distribuiti e le prestazioni di IA generativa.  NVIDIA Quantum-X800 InfiniBand, NVIDIA Spectrum™-X800 Ethernet e le DPU NVIDIA® BlueField®-3 consentono la scalabilità efficiente su centinaia e migliaia di GPU Blackwell per prestazioni ottimali delle applicazioni.

Fabbrica IA per la nuova rivoluzione industriale

NVIDIA GB300 NVL72

NVIDIA GB300 NVL72 offre prestazioni di inferenza IA 40 volte superiori rispetto alle piattaforme Hopper, 40 TB di memoria veloce e l'integrazione della piattaforma di networking con NVIDIA ConnectX®-8 SuperNIC che utilizzano Quantum-X800 InfiniBand o Spectrum™-X Ethernet. Blackwell Ultra offre prestazioni rivoluzionarie sui carichi di lavoro più complessi, dai sistemi per agenti e il ragionamento alla generazione di video in tempo reale 30 volte più veloce.

NVIDIA GB200 Grace Blackwell NVL4 Superchip

Specifiche

Specifiche di GB200 NVL72

  GB200 NVL72 Superchip Grace Blackwell GB200
Configurazioni 36 CPU Grace: 72 GPU Blackwell 1 CPU Grace: 2 GPU Blackwell
FP4 Tensor Core1 1.440 PFLOPS 40 PFLOPS
FP8/FP6 Tensor Core1 720 PFLOPS 20 PFLOPS
INT8 Tensor Core1 720 POPS 20 POPS
FP16/BF16 Tensor Core1 360 PFLOPS 10 PFLOPS
TF32 Tensor Core 180 PFLOPS 5 PFLOPS
FP32 5.760 TFLOPS 160 TFLOPS
FP64 2.880 TFLOPS 80 TFLOPS
FP64 Tensor Core 2.880 TFLOPS 80 TFLOPS
Memoria della GPU | Larghezza di banda Fino a 13,4 TB HBM3e | 576 TB/s Fino a 372 GB HBM3e | 16 TB/s
Banda NVLink 130 TB/s 3,6 TB/s
Numero di core CPU 2.592 Core Arm® Neoverse V2 72 Core Arm Neoverse V2
Memoria della CPU | Larghezza di banda Fino a 17 TB LPDDR5X | Fino a 18,4 TB/s Fino a 480 GB | Fino a 512 GB/s

Inizia

Resta aggiornato

Iscriviti per sapere quando NVIDIA Blackwell sarà disponibile.

Select Location
Middle East