NVIDIA Grace CPU-Superchip

NVIDIA Grace CPU-Superchip

Die bahnbrechende CPU für das moderne Rechenzentrum.

Ausgelegt für die Leistungs- und Effizienzanforderungen der KI-Rechenzentren von heute.

Die NVIDIA Grace™ CPU ist für eine neue Art von Rechenzentrum konzipiert, das massive Datenmengen verarbeitet, um maschinelle Intelligenz mit maximaler Energieeffizienz zu erzeugen. Diese Rechenzentren verarbeiten unterschiedliche Workloads wie KI, Datenanalyse, Hyperscale-Cloud-Anwendungen und High-Performance-Computing (HPC). Um auch die anspruchsvollsten Anforderungen eines Rechenzentrums erfüllen zu können, bietet Grace die doppelte Verarbeitungsleistung pro Watt, doppelte Packaging-Dichte und die höchste Speicherbandbreite im Vergleich zu den führenden Servern von heute.

Die Grace-CPU koppelt 72 hochleistungsfähige und energieeffiziente Arm® Neoverse™ V2-Kerne mit der NVIDIA Scalable-Coherency-Fabric (SCF), die für maximale Leistung eine Bisektionsbandbreite von 3,2 TB/s liefert – doppelt so viel wie herkömmliche CPUs, bei voller Kompatibilität mit dem Arm-Ökosystem. Grace ist die erste CPU für Rechenzentren mit Highspeed-LPDDR5X-Speicher der Serverklasse und einem breiten Speichersubsystem, das bis zu 500 GB/s Bandbreite bei einem Fünftel des Energieverbrauchs von herkömmlichem DDR-Speicher bei etwa denselben Kosten bereitstellt.

NVIDIA Grace CPU Superchip LaunchPad

In diesem kostenlosen Kurs können Sie praktische Erfahrungen mit dem NVIDIA Grace CPU-Superchip sammeln und in Demos seine Speicherbandbreite und Software-Umgebung kennenlernen.

Wir stellen vor: die NVIDIA Grace-CPU

NVIDIA Grace CPU-Superchip

Der Grace CPU-Superchip besteht aus zwei Grace-CPU-Chips, die über NVIDIA NVLink™ Chip-to-Chip (C2C) mit 900 GB/s kohärent miteinander verbunden sind. Er beinhaltet 144 Neoverse-V2-Kerne in einem einzelnen Modul mit LPDDR5X-Speicher der Serverklasse, der eine Speicherbandbreite von bis zu 1 TB/s liefert. Der Grace CPU-Superchip bildet das Herzstück eines Zweiprozessorservers in einem kompakten Modul und bietet doppelt so hohe Verarbeitungsleistung bei gleicher Leistungsaufnahme wie herkömmliche Server-CPUs mit DDR5-Speicher.

NVIDIA Grace-CPU C1

Die NVIDIA Grace C1 ist eine Einprozessor-Hochleistungs-Serverplattform, die für skalierbare und Edge-Plattformen wie Hyperscale-Cloud, CDN, Massenspeicher-, Telekommunikations- und andere Hochleistungs-Edge-Plattformen optimiert ist, ohne Abstriche bei Leistung oder Bandbreite zu machen. Diese Plattform bietet die Leistung hochwertiger x86-CPUs und kann von 140 W bis 250 W bei der Grace-CPU und LPDDR5X-Speicher konfiguriert werden, verglichen mit über 400 W für ähnliche x86-Plattformen. Dank der Scalable-Coherency-Fabric von NVIDIA ist die Energieeffizienz der Grace-CPU im Vergleich zu führenden x86-Plattformen doppelt so hoch.

Highlights

Grace-CPU verdoppelt die Rechenzentrumsleistung bei halbem Energieverbrauch

Grafikanalyse

3 X

Datenanalyse

2 X

Wetter

2 X

Microservices

1,6 X

NVIDIA Grace Superchip, 480 GB LPDDR5X, AMD EPYC 9654, 768 GB DDR5; Betriebssystem: Ubuntu 22.04, Compiler: GCC 12.3, sofern nicht unten angegeben; Leistungsaufnahme bei Ermittlung der Energieeffizienz umfasst gemessene Leistungsaufnahme von CPU und Arbeitsspeicher; Graphenanalyse: GAP-Benchmark-Suite BFS arXiv:1508.03619 [cs.DC], 2015; Datenanalyse: HiBench + K-means Spark (HiBench 7.1.1, Hadoop 3.3.3, Spark 3.3.0, Grace: NVHPC 24.5, x86: Intel 2021.4); Wetter: ICON QUBICC, 80 km Auflösung, NVHPC 24.5 (Grace), ICC 2021.4 (x86); Microservices: Google Protobufs (Commit 7cd0b6fbf1643943560d8a9fe553fd206190b27f | N Instanzen parallel)

Graphenanalyse

Der NVIDIA Grace CPU-Superchip verbindet die Arm-Neoverse-V2-Kerne mit einer eigenen NVIDIA Scaled-Coherency-Fabric, die ein superschnelles Leistungsverhalten bei Workloads wie GapBS Breadth First Search bietet, bei denen intensive Kern-zu-Kern-Kommunikation und -Synchronisierung stattfindet. NVIDIA Grace bringt mehr als die doppelte Leistung auf Serverebene und die dreifache Energieeffizienz im Vergleich zu führenden x86-Systemen.

Datenanalyse

Angesichts zunehmender Datenmengen müssen Unternehmen die Erkenntnisgewinnung aus ihren Daten maximieren, um wettbewerbsfähig zu bleiben. Die HiBench-Suite testet den k-Means-Cluster-Algorithmus für Knowledge Discovery und Data-Mining und nutzt den Speicher mit hoher Bandbreite und geringem Stromverbrauch in der NVIDIA Grace-CPU. Die Grace-CPU ist im Vergleich zu führenden x86-CPUs, die heute auf dem Markt sind, mehr als doppelt so energieeffizient.

Wetter

Wettervorhersagemodelle sind ein wichtiger Anwendungsfall für das Hochleistungsrechnen (HPC) und entscheidend für das Verständnis und die Reaktion auf sich verändernde Wettermuster als Folge des Klimawandels. Der energieeffiziente High-Bandwidth-LPDDR5X-Speicher der Grace-CPU liefert eine Bandbreite von bis zu 500 GB/s bei nur 16 Watt. So kann Grace im Vergleich zu bestehenden x86-Lösungen bei gleichem Stromverbrauch fast die doppelte Leistung erbringen.

Microservices

Microservices sind eine Sammlung kleiner unabhängiger Dienste, die Rechenzentren die einfache Skalierung bei wachsender Nachfrage ermöglichen. Zudem bieten sie Flexibilität durch die mögliche Verwaltung einzelner Dienste, ohne dass dies Auswirkungen auf die gesamte Anwendung hat. Google Protobufs misst, wie schnell das System Daten serialisieren und parsen kann, die für den Austausch von Daten zwischen Systemen benötigt werden und für die Ausführung von Microservices unerlässlich sind. Die hochleistungsfähige und stromsparende NVIDIA Grace-CPU bietet führende Leistungseigenschaften und Energieeffizienz für einen maximalen Durchsatz im Rechenzentrum.

Merkmale

Technologische Durchbrüche

Arm Neoverse-V2-Kerne

Das Herzstück der Grace-CPU sind die Arm Neoverse-V2-CPU-Kerne als aktuell leistungsstärkste Arm-Kerne für Rechenzentren auf dem Markt. Die Neoverse-V2-Kerne sind für führende Leistung pro Kern optimiert und bieten gleichzeitig unglaubliche Effizienz im Vergleich zu herkömmlichen CPUs. Die Grace-CPU integriert 72 Kerne und bietet in Kombination mit dem LPDDR5X-Speicher und der NVIDIA Scaled-Coherence-Fabric doppelt so viel Leistung bei gleichem Energieverbrauch wie führende x86-CPUs.

NVIDIA Scalable-Coherency-Fabric

Die NVIDIA Scalable-Coherency-Fabric (SCF) ist eine Mesh-Fabric und verteilte Cache-Architektur, die von NVIDIA für die Skalierung von Kernen und Bandbreite auf eine energie- und flächeneffiziente Weise entwickelt wurde. SCF liefert mit einer Gesamt-Bisektionsbandbreite von mehr als 3,2 TB/s eine doppelt so hohe Bandbreite wie herkömmliche CPUs, um den Datenfluss zwischen den CPU-Kernen, dem Speicher und dem System-I/O sicherzustellen. Die SCF reduziert Engpässe in Anwendungen mit hohem Datenfluss wie in der Graphenanalyse, in denen NVIDIA Grace bis zu doppelt so hohe Leistung wie führende x86-Server liefert.

LPDDR5X-Speicher

NVIDIA Grace ist die erste Server-CPU mit einem LPDDR5X-Speicher, der durch Mechanismen wie Fehlerkorrekturcode (ECC) hohe Zuverlässigkeit der Serverklasse bietet. Der LPDDR5X-Speicher von NVIDIA Grace bietet ein ausgewogenes Verhältnis von Kosten, Stromverbrauch, Bandbreite und Kapazität. Er liefert bis zu 500 GB/s Bandbreite bei nur 16 W, was in etwa einem Fünftel des Stromverbrauchs von herkömmlichem DDR5-Speicher entspricht.

Ein- und Zweiprozessorkonfiguration

Das NVIDIA Grace-CPU-Portfolio umfasst den Grace Superchip, der das Herzstück eines Zweiprozessorservers mit 144 Neoverse-V2-Kernen und einem LPDDR5X-Speicher bis 960 GB in einem kompakten Modul bietet, das nur 500 W für CPU und Speicher benötigt. Für zusätzliche Flexibilität stellt die Grace-CPU C1 mit 72 Neoverse-V2-Kernen, die über eine superschnelle NVIDIA Scalable-Coherency-Fabric in einer Einprozessorkonfiguration miteinander verbunden sind, die für Cloud-, Speicher-, Edge- und Telekommunikationsanwendungen optimiert ist und bis zu doppelt so viel Verarbeitungsleistung pro Watt wie herkömmliche x86-Server bietet, eine erstaunliche Leistung bereit.

News

Revolutionierung der Effizienz von Rechenzentren mit der NVIDIA Grace-Produktfamilie

Der Grace CPU-Superchip wird als einzelnes kompaktes Zwei-Sockel-Modul angeboten und bietet doppelt so hohe Leistung bei gleichem Energieverbrauch wie führende herkömmliche CPUs.

NVIDIA Grace CPU-Superchip-Architektur im Detail

Die Grace-CPU kombiniert das technische Know-how von NVIDIA mit Arm-Prozessoren, On-Chip-Fabrics, System-on-Chip-Design (SoC) und resilienter Speichertechnik mit hoher Bandbreite und geringem Stromverbrauch. Sie wurde von Grund auf neu entwickelt, um den weltweit ersten Computing-Superchip zu schaffen.

Steigerung der mathematischen Optimierungsleistung und Energieeffizienz mit der NVIDIA Grace-CPU

Angesichts der wachsenden Nachfrage nach schnelleren und besseren Lösungen für mathematische Optimierung sind ganzheitliche Innovationen unerlässlich. Dieser Blogbeitrag untersucht Benchmark-Ergebnisse und Anwendungsfälle, die die verbesserte Effizienz der ARM-basierten NVIDIA Grace-CPU demonstrieren.

Technische Daten

Grace CPU1 – Technische Daten

  NVIDIA Grace CPU C1 NVIDIA Grace CPU Superchip
Configuration 1x Grace CPU 2x Grace CPU
Core Count 72 Arm Neoverse V2 Cores with 4x 128b SVE2 144 Arm Neoverse V2 Cores with 4x 128b SVE2
L1 cache 64KB i-cache + 64KB d-cache per core 64KB i-cache + 64KB d-cache per core
L2 cache 1MB per core 1MB per core
L3 cache 114MB 228MB
LPDDR5X size 120GB, 240GB and 480GB on-module memory options available 240GB, 480GB and 960GB options available
Memory bandwidth Up to 384 GB/s for 480GB
Up to 512 GB/s for 120GB, 240GB
Up to 768 GB/s for 960GB
Up to 1024 GB/s for 240GB, 480GB
NVLink-C2C bandwidth n/a Up to 900 GB/s
PCIe Links Up to 4x PCIe Gen 5x16 with option to bifurcate Up to 8x PCIe Gen 5x16 with option to bifurcate

Jetzt loslegen

Immer aktuell

Registrieren Sie sich, um zu erfahren, ab wann NVIDIA Grace Blackwell verfügbar ist.