NVIDIA L4 Tensor Core GPU

Der bahnbrechende universelle Beschleuniger für effiziente Video-, KI- und Grafikfunktionen.

Beschleunigen Sie Video-, KI- und Grafik-Workloads

Die NVIDIA L4 Tensor Core GPU mit der NVIDIA Ada-Lovelace-Architektur bietet universelle, energieeffiziente Beschleunigung für Videofunktionen, KI, Visual Computing, Grafikfunktionen, Virtualisierung und mehr. Die L4 im Low-Profile-Formfaktor ist eine kostengünstige, energieeffiziente Lösung für hohen Durchsatz und geringe Latenz in jedem Server, vom Edge-Bereich bis zum Rechenzentrum und zur Cloud.

Bis zu 120-fache KI-Video-Leistung

Bis zu 120-fache KI-Video-Leistung

Gemessene Leistung: 8x L4 im Vergleich zu 2-Prozessor-Server mit Intel 8362 CPUs, End-to-End-Video-Pipeline mit CV-CUDA® Dekodierung, Vorverarbeitung, Inferenz (SegFormer), Nachverarbeitung, Kodierung, Inferenz mit NVIDIA® TensorRT™ 8.6 im Vergleich zu nur auf CPU basierender Pipeline mit OpenCV 4.7, PyTorch.

Beeindruckendes Echtzeit-Leistungsverhalten der KI-Video-Pipeline

Transformieren Sie Videoanwendungen mit der Leistungsfähigkeit der NVIDIA L4. Ob Sie Livestreaming für Millionen von Zuschauern bieten, Nutzern das Verfassen kreativer Geschichten ermöglichen oder immersive Erlebnisse in erweiterter und virtueller Realität (AR/VR) liefern, mit L4 ausgestattete Server erlauben das Hosting von bis zu 1040 gleichzeitigen AV1-Videostreams bei 720p30 für Benutzer mobiler Geräte.1

Mit Tensor-Recheneinheiten der vierten Generation und 1,5-mal so großem GPU-Speicher heben die NVIDIA L4 GPUs in Kombination mit der CV-CUDA® Bibliothek die Interpretation und Analyse von Videoinhalten auf ein neues Niveau. Die L4 bietet 120-mal so hohe KI-Videoleistung wie CPU-basierte Lösungen, sodass Unternehmen in Echtzeit Erkenntnisse erhalten, um Inhalte zu personalisieren, die Suchrelevanz zu verbessern, anstößige Inhalte zu erkennen und Lösungen für intelligent genutzte Arbeitsumgebungen zu implementieren.

1. Gemessene Leistung: 8x L4 AV1, Voreinstellung P1 mit geringer Latenz und Kodierung mit 720p30.

Weniger Energieverbrauch und Platzbedarf mit der L4

Da KI- und Videofunktionen immer breitere Anwendung finden, steigt die Nachfrage nach effizientem, kostengünstigem Computing mehr denn je. NVIDIA L4 Tensor Core GPUs bieten bis zu 120-fache KI-Videoleistung, was bis zu 99 % höhere Energieeffizienz und niedrigere Gesamtbetriebskosten im Vergleich zu herkömmlicher CPU-basierter Infrastruktur bewirkt. Dadurch können Unternehmen den benötigten Rack-Platz verringern und ihren CO₂-Fußabdruck deutlich reduzieren, während sie ihre Rechenzentren für wesentlich mehr Benutzer skalieren können. Mit der Energie, die durch den Wechsel von CPUs zu NVIDIA L4 GPUs in einem 2-Megawatt-Rechenzentrum eingespart wird, können fast 2000 Haushalte für ein Jahr mit Strom versorgt werden. Dies entspricht auch der CO₂-Kompensation von 172.000 Bäumen, die 10 Jahre lang gewachsen sind.2

 

2. Ergebnisse des EPA-Kalkulators mit Einsparungen von 1,677 MW.

Bessere Energieeffizienz

Bessere Energieeffizienz

Gesamtbetriebskosten von 8x L4 im Vergleich zu 2-Prozessor-Server mit Intel 8362 CPUs: End-to-End-Videopipeline mit CV-CUDA Vor- und Nachverarbeitung, Dekodierung, Inferenz (SegFormer), Kodierung, Inferenz mit TRT 8.6 im Vergleich zu nur CPU-basierter Pipeline mit OpenCV 4.7, PyTorch.

Leistungssteigerung für generative KI

2,5-fache Leistung bei generativer KI

L4 liefert 2,5-fache Leistung für generative KI

Gemessene Leistung: Bildgenerierung mit L4 im Vergleich zu T4, 512x512, Stable Diffusion v2.1, FP16, TensorRT 8.5.2.

Generative KI für Bilder und Text macht das Leben der Kunden angenehmer und die Erlebnisse in allen Branchen immersiver. NVIDIA L4 überzeugt mit bis zu 2,5-facher Leistung im Vergleich zur vorherigen GPU-Generation bei rechenintensiver generativer KI-Inferenz. Und mit 50 Prozent mehr Speicherkapazität ermöglicht die L4 GPU die Generierung größerer Bilder bis 1024x768, was bei der vorherigen GPU-Generation nicht möglich war.


Optimierte Grafikleistung

Mehr als 4-fache Echtzeit-Rendering- und mehr als 3-fache Raytracing-Leistung

Mehr als 4-fache Echtzeit-Rendering- und mehr als 3-fache Raytracing-Leistung

Gemessene Leistung: Echtzeit-Rendering: Leistung mit NVIDIA Omniverse™ für Echtzeit-Rendering bei 1080p und 4K mit NVIDIA Deep Learning Super Sampling (DLSS) 3.
Raytracing: Geometrisches Mittel der Gaming-Leistung für AAA-Titel, die Raytracing und DLSS 3 unterstützen.

Mit RT-Recheneinheiten der 3. Generation und KI-gestütztem NVIDIA Deep Learning Super Sampling 3 (DLSS 3) bietet NVIDIA L4 die 4-fache Leistung für KI-basierte Avatare, virtuelle Welten mit NVIDIA Omniverse™, Cloud-Gaming und virtuelle Workstations. Diese Funktionen ermöglichen es den Entwicklern, Echtzeit-Grafik und -Szenen in Kinoqualität für immersive visuelle Erlebnisse zu erzeugen, die mit CPUs nicht möglich sind.

Effizient und nachhaltig beschleunigte Workloads

NVIDIA L4 ist ein integraler Bestandteil der NVIDIA-Rechenzentrumsplattform. Die für Videofunktionen, KI, NVIDIA RTX™ Virtual Workstation (vWS), Grafikfunktionen, Simulation, Datenwissenschaft und Datenanalyse entwickelte Plattform beschleunigt über 3000 Anwendungen und steht auf breiter Ebene zur Verfügung, vom Rechenzentrum bis zur Edge-Umgebung und zur Cloud und bietet sowohl enorme Leistungssteigerung als auch Energieeffizienzpotenzial.

Die für gängige Bereitstellungen optimierte L4 GPU mit Low-Profile-Formfaktor hat eine relativ geringe Leistungsaufnahme von 72 W, was sie zu einer effizienten, kosteneffektiven Lösung für jede Server- oder Cloud-Instanz aus dem Partner-Ökosystem von NVIDIA macht.

Entwicklung und Bereitstellung mit unternehmensgerechter KI-Software

Die Softwaresuite NVIDIA AI Enterprise wurde für die Entwicklung und Bereitstellung von KI optimiert und beinhaltet Workflows, Frameworks, vortrainierte Modelle und Infrastrukturoptimierungen für KI-Lösungen, die für die Ausführung auf gängigen Rechenzentrumsplattformen und gängigen NVIDIA-Certified Systems™ mit NVIDIA L4 GPUs zertifiziert sind.

NVIDIA AI Enterprise ist eine zusätzliche Lizenz für NVIDIA L4 GPUs, die KI für nahezu jedes Unternehmen mit der höchsten Leistung in den Bereichen Training, Inferenz und Datenwissenschaft zugänglich macht. NVIDIA AI Enterprise und NVIDIA L4 vereinfachen den Aufbau einer KI-fähigen Plattform, beschleunigen die Entwicklung und Bereitstellung von KI und bieten Leistung, Sicherheit und Skalierbarkeit, um schneller Erkenntnisse zu gewinnen und früher einen geschäftlichen Mehrwert zu erzielen.

Unternehmen, die L4 einsetzen

Technische Daten

Formfaktor L4
Formfaktor L4
FP32 30,3 TeraFLOPS
TF32-Tensor-Recheneinheit 120 TeraFLOPS*
FP16-Tensor-Recheneinheit 242 TeraFLOPS*
BFLOAT16-Tensor-Recheneinheit 242 TeraFLOPS*
FP8-Tensor-Core 485 TeraFLOPs*
INT8-Tensor-Recheneinheit 485 TOPS*
GPU-Speicher 24 GB
GPU-Speicherbandbreite 300 GB/s
NVENC | NVDEC | JPEG-Dekoder 2 | 4 | 4
Max. Thermal Design Power (TDP) 72 W
Formfaktor 1 Steckplatz, Low-Profile, PCIe
Schnittstelle PCIe Gen4 x16, 64 GB/s
Serveroptionen Partner und NVIDIA-Certified Systems mit 1–8 GPUs

* Mit Sparsity dargestellt. Die Daten sind ohne Sparsity um die Hälfte niedriger.

Erste Schritte mit dem L4-Early-Access auf Google Cloud.