NVIDIA Grace CPU-Superchip

NVIDIA Grace CPU-Superchip

Die bahnbrechende CPU für das moderne Rechenzentrum.

Ausgelegt für die Leistungs- und Effizienzanforderungen der KI-Rechenzentren von heute.

Die NVIDIA Grace™ CPU ist für eine neue Art von Rechenzentrum konzipiert – eines, das massive Datenmengen verarbeitet, um maschinelle Intelligenz mit maximaler Energieeffizienz zu erzeugen. Diese Rechenzentren führen verschiedene Workloads wie KI, Datenanalysen, Hyperscale-Cloud-Anwendungen und High-Performance-Computing (HPC) aus. Um auch die anspruchsvollsten Anforderungen eines Rechenzentrums erfüllen zu können, bietet Grace die doppelte Verarbeitungsleistung pro Watt, doppelte Packaging-Dichte und die höchste Speicherbandbreite im Vergleich zu den führenden Servern von heute.

Die Grace-CPU kombiniert 72 hochleistungsfähige und energieeffiziente Arm® Neoverse™ V2-Kerne mit der NVIDIA Scalable-Coherency-Fabric (SCF), die für maximale Leistung eine Bisektionsbandbreite von 3,2 TB/s liefert – doppelt so viel wie herkömmliche CPUs, bei voller Kompatibilität mit dem Arm-Ökosystem. Grace ist die erste CPU für Rechenzentren mit Highspeed-LPDDR5X-Speicher der Serverklasse und einem breiten Speichersubsystem, das bis zu 500 GB/s Bandbreite bei einem Fünftel des Energieverbrauchs von herkömmlichem DDR-Speicher bei etwa denselben Kosten bereitstellt.

NVIDIA Grace CPU für Entwickler

Lernen Sie unsere Entwickler-Tools für das NVIDIA Grace-CPU-Portfolio kennen. Hier finden Sie Ressourcen, Anleitungen, Treiber und mehr.

Wir stellen vor: die NVIDIA Grace-CPU

NVIDIA Grace CPU-Superchip

NVIDIA Grace CPU-Superchip

Der Grace CPU-Superchip besteht aus zwei Grace-CPU-Chips, die über NVIDIA NVLink™ Chip-to-Chip (C2C) mit 900 GB/s kohärent miteinander verbunden sind. Er beinhaltet 144 Neoverse-V2-Kerne in einem einzelnen Modul mit LPDDR5X-Speicher der Serverklasse, der eine Speicherbandbreite von bis zu 1 TB/s liefert. Der Grace CPU-Superchip bildet das Herzstück eines Zweiprozessorservers in einem kompakten Modul und bietet doppelt so hohe Verarbeitungsleistung bei gleicher Leistungsaufnahme wie herkömmliche Server-CPUs mit DDR5-Speicher.

NVIDIA Grace-CPU C1

NVIDIA Grace-CPU C1

Die NVIDIA Grace C1 ist eine Einprozessor-Hochleistungs-Serverplattform, die für skalierbare und Edge-Plattformen wie Hyperscale-Cloud, CDN, Massenspeicher-, Telekommunikations- und andere Hochleistungs-Edge-Plattformen optimiert ist, ohne Abstriche bei Leistung oder Bandbreite zu machen. Diese Plattform bietet die Leistung hochwertiger x86-CPUs und kann von 140 W bis 250 W bei der Grace-CPU und LPDDR5X-Speicher konfiguriert werden, verglichen mit über 400 W für ähnliche x86-Plattformen. Dank der Scalable-Coherency-Fabric von NVIDIA ist die Energieeffizienz der Grace-CPU im Vergleich zu führenden x86-Plattformen doppelt so hoch.

Highlights

Grace-CPU verdoppelt die Rechenzentrumsleistung bei halbem Energieverbrauch

Graphenanalyse

3x

Datenanalyse

2x

Wetter

2x

Microservices

1.6x

NVIDIA Grace Superchip, 480 GB LPDDR5X, AMD EPYC 9654, 768 GB DDR5. Betriebssystem: Ubuntu 22.04 Compiler: GCC 12.3, sofern nicht unten angegeben. Leistungsaufnahme bei Ermittlung der Energieeffizienz umfasst gemessene Leistung von CPU und Arbeitsspeicher. Graphenanalyse: GAP-Benchmark-Suite BFS arXiv:1508.03619 [cs.DC], 2015. Datenanalyse: HiBench + K-means Spark (HiBench 7.1.1, Hadoop 3.3.3, Spark 3.3.0, Grace: NVHPC 24.5, x86: Intel 2021.4); Wetter: ICON QUBICC, 80 km Auflösung, NVHPC 24.5 (Grace), ICC 2021.4 (x86); Microservices: Google Protobufs (Commit 7cd0b6fbf1643943560d8a9fe553fd206190b27f | N Instanzen parallel)

Graphenanalyse mit NVIDIA Grace CPU-Superchip

Graphenanalyse

Der NVIDIA Grace CPU-Superchip verbindet die Arm-Neoverse-V2-Kerne mit einer eigenen NVIDIA Scaled-Coherency-Fabric, die ein superschnelles Leistungsverhalten bei Workloads wie GapBS Breadth First Search bietet, bei denen intensive Kern-zu-Kern-Kommunikation und -Synchronisierung stattfindet. NVIDIA Grace bringt mehr als die doppelte Leistung auf Serverebene und die dreifache Energieeffizienz im Vergleich zu führenden x86-Systemen.

Datenanalyse mit NVIDIA Grace CPU-Superchip

Datenanalyse

Angesichts zunehmender Datenmengen müssen Unternehmen die Erkenntnisgewinnung aus ihren Daten maximieren, um wettbewerbsfähig zu bleiben. Die HiBench-Suite testet den k-Means-Cluster-Algorithmus für Knowledge Discovery und Data-Mining und nutzt den Speicher mit hoher Bandbreite und geringem Stromverbrauch in der NVIDIA Grace-CPU. Die Grace-CPU ist im Vergleich zu führenden x86-CPUs, die heute auf dem Markt sind, mehr als doppelt so energieeffizient.

Wettervorhersagemodelle für Hochleistungsrechnen (HPC)

Wetter

Wettervorhersagemodelle sind ein wichtiger Anwendungsfall für das Hochleistungsrechnen (HPC) und entscheidend für das Verständnis und die Reaktion auf sich verändernde Wettermuster als Folge des Klimawandels. Der energieeffiziente High-Bandwidth-LPDDR5X-Speicher der Grace-CPU liefert eine Bandbreite von bis zu 500 GB/s bei nur 16 Watt. So kann Grace im Vergleich zu bestehenden x86-Lösungen bei gleichem Stromverbrauch fast die doppelte Leistung erbringen.

NVIDIA Grace-CPU bietet führende Leistung und Energieeffizienz

Microservices

Microservices sind eine Sammlung kleiner unabhängiger Dienste, die Rechenzentren die einfache Skalierung bei wachsender Nachfrage ermöglichen. Zudem bieten sie Flexibilität durch die mögliche Verwaltung einzelner Dienste, ohne dass dies Auswirkungen auf die gesamte Anwendung hat. Google Protobufs misst, wie schnell das System Daten serialisieren und parsen kann, die für den Austausch von Daten zwischen Systemen benötigt werden und für die Ausführung von Microservices unerlässlich sind. Die hochleistungsfähige und stromsparende NVIDIA Grace-CPU bietet führende Leistungseigenschaften und Energieeffizienz für einen maximalen Durchsatz im Rechenzentrum.

Eigenschaften

Technologische Durchbrüche

Arm Neoverse-V2-Kerne

Arm Neoverse-V2-Kerne

Das Herzstück der Grace-CPU sind die Arm Neoverse-V2-CPU-Kerne als aktuell leistungsstärkste Arm-Kerne für Rechenzentren auf dem Markt. Die Neoverse-V2-Kerne sind für führende Leistung pro Kern optimiert und bieten gleichzeitig unglaubliche Effizienz im Vergleich zu herkömmlichen CPUs. Die Grace-CPU integriert 72 Kerne und bietet in Kombination mit dem LPDDR5X-Speicher und der NVIDIA Scaled-Coherence-Fabric doppelt so viel Leistung bei gleichem Energieverbrauch wie führende x86-CPUs.

NVIDIA Scalable-Coherency-Fabric

NVIDIA Scalable-Coherency-Fabric

Die NVIDIA Scalable-Coherency-Fabric (SCF) ist eine Mesh-Fabric und verteilte Cache-Architektur, die von NVIDIA für die Skalierung von Kernen und Bandbreite auf eine energie- und flächeneffiziente Weise entwickelt wurde. SCF liefert mit einer Gesamt-Bisektionsbandbreite von mehr als 3,2 TB/s eine doppelt so hohe Bandbreite wie herkömmliche CPUs, um den Datenfluss zwischen den CPU-Kernen, dem Speicher und dem System-I/O sicherzustellen. Die SCF reduziert Engpässe in Anwendungen mit hohem Datenfluss wie in der Graphenanalyse, in denen NVIDIA Grace bis zu doppelt so hohe Leistung wie führende x86-Server liefert.

LPDDR5X-Speicher

LPDDR5X-Speicher

NVIDIA Grace ist die erste Server-CPU mit einem LPDDR5X-Speicher, der durch Mechanismen wie Fehlerkorrekturcode (ECC) hohe Zuverlässigkeit der Serverklasse bietet. Der LPDDR5X-Speicher von NVIDIA Grace bietet ein ausgewogenes Verhältnis von Kosten, Stromverbrauch, Bandbreite und Kapazität. Er liefert bis zu 500 GB/s Bandbreite bei nur 16 W, was in etwa einem Fünftel des Stromverbrauchs von herkömmlichem DDR5-Speicher entspricht.

Ein- und Zweiprozessorkonfiguration

Ein- und Zweiprozessorkonfiguration

Das NVIDIA Grace-CPU-Portfolio umfasst den Grace Superchip, der das Herzstück eines Zweiprozessorservers mit 144 Neoverse-V2-Kernen und einem LPDDR5X-Speicher bis 960 GB in einem kompakten Modul bietet, das nur 500 W für CPU und Speicher benötigt. Für zusätzliche Flexibilität stellt die Grace-CPU C1 mit 72 Neoverse-V2-Kernen, die über eine superschnelle NVIDIA Scalable-Coherency-Fabric in einer Einprozessorkonfiguration miteinander verbunden sind, die für Cloud-, Speicher-, Edge- und Telekommunikationsanwendungen optimiert ist und bis zu doppelt so viel Verarbeitungsleistung pro Watt wie herkömmliche x86-Server bietet, eine erstaunliche Leistung bereit.

Neuigkeiten

NVIDIA Grace-Produktfamilie

Die NVIDIA Grace CPU bietet Rechenzentrumsleistung der Weltklasse und bahnbrechende Energieeffizienz.

NVIDIA hat die NVIDIA Grace CPU als neuartige hochleistungsfähige Rechenzentrums-CPU konzipiert, die bahnbrechende Energieeffizienz bietet und für die Performance-Anforderungen in Rechenzentren optimiert ist.

NVIDIA Grace CPU-Superchip

Die NVIDIA Grace CPU ist mit der Arm-Software-Systemlandschaft kompatibel

Rechenzentren steuern zunehmend auf Energieengpässe zu, weshalb es darauf ankommt, so viele Workloads wie möglich zu beschleunigen und den Rest mit möglichst effizienter Rechenleistung auszuführen. Die Grace-CPU ist dafür optimiert, sowohl beschleunigte als auch reine CPU-Aufgaben auszuführen und bietet bis zu 2-fache Leistung bei gleichem Energieverbrauch wie herkömmliche CPUs.

NVIDIA Grace CPU Superchip

Spotlight: Petrobras beschleunigt lineare Gleichungslöser für die Reservoir-Simulation mit der NVIDIA Grace CPU.

In diesem Blog wird gezeigt, wie sich die NVIDIA Grace CPU bei der Lösung linearer Systeme in diesem Workflow auszeichnet. Petrobras erzielt im Vergleich zu alternativen x86-basierten CPUs bis zu 4,5-mal so schnelle Lösungsfindung, 4,3-fach höhere Energieeffizienz und 1,5-fach höhere Skalierbarkeit.

Technische Daten

Grace CPU1Technische Daten

  NVIDIA Grace CPU C1 NVIDIA Grace CPU Superchip
Configuration 1x Grace CPU 2x Grace CPU
Core Count 72 Arm Neoverse V2 Cores with 4x 128b SVE2 144 Arm Neoverse V2 Cores with 4x 128b SVE2
L1 cache 64KB i-cache + 64KB d-cache per core 64KB i-cache + 64KB d-cache per core
L2 cache 1MB per core 1MB per core
L3 cache 114MB 228MB
LPDDR5X size 120GB, 240GB and 480GB on-module memory options available 240GB, 480GB and 960GB options available
Memory bandwidth Up to 384 GB/s for 480GB
Up to 512 GB/s for 120GB, 240GB
Up to 768 GB/s for 960GB
Up to 1024 GB/s for 240GB, 480GB
NVLink-C2C bandwidth n/a Up to 900 GB/s
PCIe Links Up to 4x PCIe Gen 5x16 with option to bifurcate Up to 8x PCIe Gen 5x16 with option to bifurcate

Jetzt starten

Immer aktuell

Melden Sie sich an, um zu erfahren, ab wann NVIDIA Grace Blackwell verfügbar ist.

Select Location
Middle East