NVIDIA H200 Tensor Core-Grafikkarte

Superturbo für KI- und HPC-Workloads.

Jetzt verfügbar.

Die Grafikkarte für generative KI und HPC

Die NVIDIA H200-Tensor-Core-Grafikkarte bietet generative KI- und HPC(High-Performance Computing)-Workloads mit bahnbrechender Leistung und Speicherkapazität. Als erste Grafikkarte mit HBM3e treibt der größere und schnellere Speicher der H200 die Beschleunigung generativer KI und großer Sprachmodelle (LLMs) an und beschleunigt gleichzeitig wissenschaftliche Berechnungen für HPC-Workloads.

NVIDIA unterstützt Hopper, die weltweit führende KI-Computing-Plattform

Die NVIDIA HGX H200 verfügt über die NVIDIA H200 Tensor Core-Grafikkarte mit erweitertem Speicher, um riesige Datenmengen für generative KI- und HPC-Workloads zu verarbeiten.

Highlights

Experience Next-Level Performance

LLama2 70B-Inferenz

1,9X schneller

GPT3-175B-Inferenz

1,6X schneller

High-Performance Computing

110X schneller

Vorteile

Höhere Leistung mit größerem und schnellerem Speicher

Die NVIDIA H200 basiert auf der NVIDIA Hopper™- Architektur und ist die erste Grafikkarte mit 141 Gigabyte (GB) HBM3e-Speicher bei einer Leistung von 4,8 Terabyte pro Sekunde (TB/s) – das entspricht fast der doppelten Kapazität der NVIDIA H100 Tensor Core-Grafikkarte mit 1,4-facher Speicherbandbreite. Der größere und schnellere Speicher der H200 beschleunigt generative KI und LLMs und bringt gleichzeitig das wissenschaftliche Computing für HPC-Workloads mit besserer Energieeffizienz und niedrigeren Gesamtbetriebskosten voran.

Vorläufige Spezifikationen. Änderungen vorbehalten.
Llama2 13B: ISL 128, OSL 2K | Durchsatz | H100 SXM 1x Grafikkarte BS 64 | H200 SXM 1x Grafikkarte BS 128
GPT-3 175B: ISL 80, OSL 200 | x8 H100 SXM Grafikkarten BS 64 | x8 H200 SXM Grafikkarten BS 128
Llama2 70B: ISL 2K, OSL 128 | Durchsatz | H100 SXM 1x Grafikkarte BS 8 | H200 SXM 1x Grafikkarte BS 32.

Erkenntnisse mit hochleistungsfähiger LLM-Inferenz gewinnen

In der sich ständig weiterentwickelnden KI-Landschaft verlassen sich Unternehmen auf LLMs, um eine Vielzahl von Inferenzanforderungen zu erfüllen. Ein KI-Inferenzbeschleuniger muss den höchsten Durchsatz bei geringstmöglichen Gesamtbetriebskosten bieten, wenn er für eine riesige Nutzerbasis im großen Umfang bereitgestellt wird.

Die H200 verdoppelt die Inferenzgeschwindigkeit bei der Verarbeitung von LLMs wie Llama2 im Vergleich zu H100-Grafikprozessoren.

High-Performance Computing mit Superturbo

Die Speicherbandbreite ist für HPC-Anwendungen von entscheidender Bedeutung, da sie eine schnellere Datenübertragung ermöglicht und Engpässe bei der komplexen Verarbeitung reduziert. Für speicherintensive HPC-Anwendungen wie Simulationen, Forschung und künstliche Intelligenz stellt die höhere Speicherbandbreite von H200 sicher, dass Daten effizient abgerufen und bearbeitet werden können, was bis zu einer 110-mal schnelleren Ergebnisbereitstellung im Vergleich zu CPUs führt.

Vorläufige Spezifikationen. Änderungen vorbehalten.
HPC MILC – Datensatz NERSC Apex Medium | HGX H200 4-Grafikkarte | Dual Sapphire Rapids 8480
HPC-Anwendungen – CP2K: Datensatz H2O-32-RI-dRPA-96points | GROMACS: Datensatz STMV | ICON: Datensatz r2b5 | MILC: Datensatz NERSC Apex Medium | Chroma: Datensatz HMC Medium | Quantum Espresso: Datensatz AUSURF112 | 1 x H100 SXM | 1 H200 SXM.

Vorläufige Spezifikationen. Änderungen vorbehalten.
Lama2 70B: ISL 2K, OSL 128 | Durchsatz | H100 SXM 1x Grafikkarte BS 8 | H200 SXM 1x Grafikkarte BS 32

Reduzierung des Energieverbrauchs und der Gesamtbetriebskosten

Mit der Einführung der H200 erreichen Energieeffizienz und Gesamtbetriebskosten ein neues Niveau. Diese bahnbrechende Technologie bietet unvergleichliche Leistung innerhalb desselben Leistungsprofils wie die H100. KI-Werke und Supercomputing-Systeme, die nicht nur schneller, sondern auch umweltfreundlicher sind, bieten einen wirtschaftlichen Vorteil, der die KI- und Wissenschaftswelt voranbringt.

KI-Beschleunigung für Mainstream-Enterprise-Server

Die NVIDIA H200 NVL ist die ideale Wahl für Kunden mit eingeschränkten Platzverhältnissen im Rechenzentrum, da sie größenunabhängige Beschleunigung für jede KI- und HPC-Workload bietet. Dank der 1,5-fachen Speichergröße und der 1,2-fachen Bandbreite gegenüber der Vorgängergeneration können Kunden LLMs innerhalb weniger Stunden optimieren und eine 1,8-mal schnellere LLM-Inferenz erzielen.

Unternehmensfähig: KI-Software optimiert Entwicklung und Bereitstellung

NVIDIA AI Enterprise vereinfacht dank NVIDIA H200 den Aufbau einer KI-fähigen Plattform und beschleunigt die Entwicklung und Bereitstellung von produktionstauglicher generativer KI, Computer Vision, Sprach-KI und vielem mehr. Zusammen mit den NIM-Inferenz-Microservices bieten die Bereitstellungen Sicherheit, Verwaltbarkeit, Stabilität und Support auf Unternehmensniveau. So werden schnellere, aussagekräftige Erkenntnisse und ein messbarer Geschäftswert ermöglicht.

Technische Daten

NVIDIA H200 Tensor Core-Grafikkarte

Formfaktor H200 SXM¹ H200 NVL¹
FP64 34 TFLOPS 34 TFLOPS
FP64 Tensor-Core 67 TFLOPS 67 TFLOPS
FP32 67 TFLOPS 67 TFLOPS
TF32 Tensor-Core 989 TFLOPS² 989 TFLOPS2²
BFLOAT16 Tensor-Core 1,979 TFLOPS² 1,979 TFLOPS²
FP16 Tensor-Core 1,979 TFLOPS² 1,979 TFLOPS²
FP8 Tensor-Core 3,958 TFLOPS² 3,958 TFLOPS²
INT8 Tensor-Core 3,958 TFLOPS² 3,958 TFLOPS²
Grafikkartenspeicher 141GB 141GB
Grafikkartenspeicher-Bandbreite 4,8TB/s 4,8TB/s
Decoder 7 NVDEC
7 JPEG
7 NVDEC
7 JPEG
Confidential Computing Unterstützt Unterstützt
Max. Thermal Design Power (TDP) Bis zu 700 W (konfigurierbar) Bis zu 600 W (konfigurierbar)
Mehr-Instanzen-Grafikkarte Bis zu 7 MIGs mit je 16,5 GB Bis zu 7 MIGs mit je 16,5 GB
Formfaktor SXM PCIe
Konnektivität NVIDIA NVLink®: 900GB/s
PCIe Gen5: 128GB/s
2- oder 4-Way-NVIDIA NVLink-Bridge: 900 GB/s PCIe Gen5: 128 GB/s
Serveroptionen NVIDIA HGX™ H200-Partner und NVIDIA-Certified Systems™ mit 4 oder 8 Grafikkarten NVIDIA MGX™ H200 NVL-Partner und NVIDIA-Certified Systems mit bis zu 8 Grafikkarten
NVIDIA AI Enterprise Add-on Inbegriffen

LErfahren Sie mehr über die Leistung unserer Rechenzentrumsprodukte bei Training und Inferenz.

NVIDIA H200-Tensor-Core-Grafikkarte – Technische Daten (Kurzfassung)