NVIDIA Grace CPU Superchip

NVIDIA Grace CPU Superchip

La CPU all'avanguardia per i data center moderni.

Progettato per soddisfare le esigenze di prestazioni ed efficienza dei data center IA di oggi

La CPU NVIDIA Grace™ è progettata per un nuovo tipo di data center, che elabora i flussi di dati per produrre informazioni con la massima efficienza energetica. Questi data center eseguono carichi di lavoro diversi come IA, analisi dati, applicazioni cloud iperscalabili e calcolo ad alte prestazioni (HPC). Per soddisfare le esigenze dei data center più esigenti, Grace offre il doppio delle prestazioni per watt, il doppio dellla densità di packaging e la massima larghezza di banda di memoria rispetto ai server leader di oggi.

La CPU Grace combina 72 core Arm® NeoverseTM V2 ad alte prestazioni ed efficienza energetica, collegati con NVIDIA Scalable Coherency Fabric (SCF), che offre 3,2 TB/s di larghezza di banda in bisezione, il doppio delle CPU tradizionali, per fornire le massime prestazioni, mantenendo la piena compatibilità con l'ecosistema Arm. Grace è la prima CPU per data center a utilizzare la memoria LPDDR5X ad alta velocità di livello server con un ampio sottosistema di memoria che offre fino a 500 GB/s di larghezza di banda a un quinto del consumo energetico della memoria DDR tradizionale a un costo simile.

LaunchPad del Superchip della CPU NVIDIA Grace

Questo laboratorio gratuito offre un'esperienza pratica con il Superchip della CPU NVIDIA Grace e potrai interagire con le demo della sua larghezza di banda di memoria e dell'ambiente software.

Conosci la CPU NVIDIA Grace

NVIDIA Grace CPU Superchip

Il Superchip della CPU Grace è composto da due chip della CPU Grace collegati in modo coerente tramite NVIDIA NVLink™ Chip-to-Chip (C2C) a 900 GB/s. Contiene 144 core Neoverse V2 in un singolo modulo, con memoria LPDDR5X di livello server che offre fino a 1 TB/s di larghezza di banda di memoria. Il Superchip della CPU Grace comprende il cuore di un server a doppio socket in un modulo compatto, offrendo il doppio delle prestazioni allo stesso consumo energetico delle CPU per server tradizionali con memoria DDR5.

NVIDIA Grace CPU C1

NVIDIA Grace C1 è una piattaforma server a singolo socket ad alte prestazioni ottimizzata per piattaforme scalabili ed edge, tra cui cloud hyperscale, CDN, storage, telco e altre piattaforme edge ad alte prestazioni senza compromessi nelle prestazioni o nella larghezza di banda. Questa piattaforma offre prestazioni x86 di fascia alta, pur essendo configurabile da 140 W a 250 W per la CPU Grace e la memoria LPDDR5X rispetto agli oltre 400 W per piattaforme x86 simili. NVIDIA Scalable Coherency Fabric consente alla CPU Grace di offrire il doppio dell'efficienza energetica rispetto alle principali piattaforme x86.

Luminosità

Doppio output del data center o consumo energetico ridotto fino a metà con la CPU Grace

Analisi di grafici

3X

Analisi dei dati

2X

Meteo

2X

Microservizi

1,6X

Il Superchip NVIDIA Grace da 480 GB di LPDDR5X, AMD EPYC 9654 768 GB di DDR5. OS: Ubuntu 22.04 Compiler: GCC 12.3 se non indicato di seguito. La potenza per risparmio energetico include la potenza misurata di CPU + memoria. Analisi di grafici: The Gap Benchmarks Suite BFS arXiv: 1508.03619 [cs.DC], 2015. Analisi dati: HiBench + K-means Spark (HiBench 7.1.1, Hadoop 3.3.3, Spark 3.3.0; Grace: NVHPC 24.5, x86: Intel 2021.4) Meteo: ICON QUBICC 80 km risoluzione NVHPC 24.5 (Grace) ICC 2021.4 (x86) Microservizi: Google Protobufs (Commit 7cd0b6fbf1643943560d8a9fe553fd206190b27f | N istanze in parallelo)

Analisi di grafici

Il Superchip della CPU NVIDIA Grace collega i core Arm Neoeverse V2 con un tessuto NVIDIA Scaled Coherency personalizzato che offre prestazioni straordinarie per carichi di lavoro come GapBS Breadth First Search che evidenziano la comunicazione e la sincronizzazione core-to-core. NVIDIA Grace offre il doppio delle prestazioni a livello di server e il triplo dell'efficienza energetica rispetto ai principali sistemi x86.

Analisi dei dati

Considerando i dati in continua crescita, le aziende devono massimizzare l'apprendimento da essi per essere competitive. La suite HiBench testa il clustering K-means per l'estrazione di conoscenza e il data mining e sfrutta la memoria a banda larga e a risparmio energetico della CPU NVIDIA Grace. La CPU Grace è oltre il doppio più efficiente dal punto di vista energetico rispetto alle principali CPU x86 presenti oggi sul mercato.

Meteo

I modelli di previsione meteorologica sono un importante caso d'uso per il calcolo ad alte prestazioni (HPC) e sono fondamentali per comprendere e rispondere ai cambiamenti dei modelli meteorologici a seguito dei cambiamenti climatici. La memoria LPDDR5X ad alta larghezza di banda e a basso consumo energetico della CPU Grace, che offre fino a 500 GB/s di larghezza di banda con soli 16 W, consente a Grace di completare quasi il doppio del lavoro con la stessa potenza rispetto alle soluzioni x86 esistenti.

Microservizi

I microservizi sono un insieme di piccoli servizi indipendenti che consentono ai data center di scalare facilmente per soddisfare la domanda. Offrono inoltre la flessibilità di gestire singoli servizi senza influire sull'intera applicazione. Google Protobufs misura la velocità con cui il sistema può serializzare e analizzare i dati necessari per lo scambio di dati tra sistemi essenziali per l'esecuzione di microservizi. Le elevate prestazioni e l'efficienza energetica della CPU Grace di NVIDIA offrono prestazioni ed efficienza energetica all'avanguardia per massimizzare la produttività dei data center.

Caratteristiche

Scoperte tecnologiche

Core Arm Neoverse V2

Al centro della CPU Grace ci sono i core della CPU Arm Neoverse V2, il fulcro del data center dalle prestazioni più elevate di Arm attualmente sul mercato. I core Neoverse V2 sono ottimizzati per offrire prestazioni massime per core, fornendo al contempo un'efficienza incredibile rispetto alle CPU tradizionali. La CPU Grace integra 72 core e, in combinazione con la memoria LPDDR5X e NVIDIA Scaled Coherency Fabric, offre il doppio delle prestazioni con la stessa potenza delle CPU x86 leader.

NVIDIA Scalable Coherency Fabric

NVIDIA Scalable Coherency Fabric (SCF) è un'architettura mesh fabric e a cache distribuita progettata da NVIDIA per soddisfare le sfide di scalabilità dei core e della larghezza di banda in modo efficiente in termini di potenza e area. SCF fornisce oltre 3,2 TB/s di larghezza di banda totale in bisezione, il doppio di quanto previsto dalle CPU tradizionali, per mantenere il flusso di dati tra i core della CPU, la memoria e l'I/O del sistema. SCF riduce i rallentamenti nelle applicazioni che richiedono un elevato volume di dati, come l'analisi dei grafici, dove NVIDIA Grace offre fino al doppio delle prestazioni dei principali server x86.

Memoria LPDDR5X

NVIDIA Grace è la prima CPU per server a utilizzare la memoria LPDDR5X con un'affidabilità di livello server grazie a meccanismi come il codice di correzione degli errori (ECC). La memoria LPDDR5X di NVIDIA Grace bilancia costi, potenza, larghezza di banda e capacità. Offre fino a 500 GB/s con soli 16 W, circa un quinto della potenza delle memorie DDR5 convenzionali.

Socket singolo e doppio

Il portafoglio della CPU NVIDIA Grace include il superchip Grace che fornisce il cuore di un server a doppio socket con 144 core Neoverse V2 e fino a 960 GB di LPDDR5X in un singolo modulo compatto che richiede solo 500 W per la CPU e la memoria. Per fornire maggiore flessibilità, la CPU Grace C1 offre prestazioni sorprendenti con 72 core Neoverse V2 collegati da un Scalable Coherency Fabric NVIDIA dalla velocità elevata in una configurazione a singolo socket ottimizzata per implementazioni cloud, storage, edge e telco al fine di fornire fino al doppio delle prestazioni per W rispetto ai server x86 convenzionali.

Notizie

Rivoluzionare l'efficienza dei data center con la famiglia NVIDIA Grace

Disponibile in un modulo compatto a socket singolo o doppio, il Superchip della CPU Grace offre il doppio delle prestazioni con lo stesso consumo energetico delle principali CPU tradizionali.

Approfondimento dell'architettura del Superchip della CPU NVIDIA Grace

Combinando l'esperienza NVIDIA con i processori Arm, i tessuti on-chip, il design system-on-chip (SoC) e le resilienti tecnologie di memoria a banda larga e a basso consumo, la CPU Grace è stata costruita da zero per creare il primo superchip di computing al mondo.

Aumentare le prestazioni di ottimizzazione matematica e l'efficienza energetica sulla CPU NVIDIA Grace

Vista la crescente domanda di soluzioni di ottimizzazione matematica migliori e più veloci, è necessaria un’innovazione full-stack. Questo post del blog esplora i risultati dei benchmark e i casi d'uso che mostrano una migliore efficienza utilizzando la CPU NVIDIA Grace basata su Arm.

Specifiche

CPU Grace 1 Specifiche tecniche

  NVIDIA Grace CPU C1 NVIDIA Grace CPU Superchip
Configuration 1x Grace CPU 2x Grace CPU
Core Count 72 Arm Neoverse V2 Cores with 4x 128b SVE2 144 Arm Neoverse V2 Cores with 4x 128b SVE2
L1 cache 64KB i-cache + 64KB d-cache per core 64KB i-cache + 64KB d-cache per core
L2 cache 1MB per core 1MB per core
L3 cache 114MB 228MB
LPDDR5X size 120GB, 240GB and 480GB on-module memory options available 240GB, 480GB and 960GB options available
Memory bandwidth Up to 384 GB/s for 480GB
Up to 512 GB/s for 120GB, 240GB
Up to 768 GB/s for 960GB
Up to 1024 GB/s for 240GB, 480GB
NVLink-C2C bandwidth n/a Up to 900 GB/s
PCIe Links Up to 4x PCIe Gen 5x16 with option to bifurcate Up to 8x PCIe Gen 5x16 with option to bifurcate

Operazioni preliminari

Resta aggiornato

Iscriviti per sapere quando NVIDIA Grace Blackwell sarà disponibile.