Unübertroffene KI- und Grafikleistung für Rechenzentren.
NVIDIA-Partner finden.
Datenblatt | Produktübersicht | Technische Daten | Deep Learning Performance Pages
Erleben Sie bahnbrechende Multi-Workload-Leistung mit dem NVIDIA L40S-Grafikprozessor. Der L40S-Grafikprozessor vereint leistungsstarke KI-Rechenleistung und erstklassige Grafik- und Medienbeschleunigung und ist auf die nächste Generation von Rechenzentrums-Workloads ausgelegt – von generativer KI und Inferenz und Training für Large Language Models (LLM) bis hin zu 3D-Grafik, Rendering und Videos.
NVIDIA OVX™ Server mit neuen NVIDIA-Grafikprozessoren zur Beschleunigung von AI-Training und Inferenzen sowie grafikintensiven Workloads sind bald von Dell, Hewlett Packard Enterprise, Lenovo, Supermicro und weiteren erhältlich.
1.466 TFLOPS¹
212 TFLOPS
91,6 TFLOPS
1 Spitzenwerte basieren auf GPU-Boost-Taktung.
Hardwareunterstützung für Structural Sparsity und das optimierte TF32-Format bieten Leistungssteigerungen ab Werk für schnelleres KI- und Datenwissenschaftsmodelltraining. Beschleunigen Sie KI-optimierte Grafikfunktionen mit DLSS, um die Auflösung mit besserer Leistung in ausgewählten Anwendungen zu skalieren.
Verbesserter Durchsatz und gleichzeitige Raytracing- und Shading-Funktionen verbessern die Raytracing-Leistung und beschleunigen die Render-Prozesse für Workflows in Produktdesign und Architektur, Ingenieurwesen und Bau. Erleben Sie lebensechte Designs in Aktion mit hardwarebeschleunigter Bewegungsunschärfe und beeindruckenden Echtzeitanimationen.
Der beschleunigte Gleitkommadurchsatz mit einfacher Genauigkeit (FP32) und die verbesserte Energieeffizienz ermöglichen signifikante Leistungsverbesserungen für Workflows wie die Entwicklung von 3D-Modellen und die Simulation von computergestütztem Engineering (CAE). Unterstützt verbesserte 16-Bit-Mathematik-Funktionen (BF16) für Mixed-Precision-Workloads.
Die Transformer-Engine beschleunigt die KI-Leistung erheblich und verbessert die Speicherauslastung sowohl für das Training als auch für die Inferenz. Die Transformer-Engine nutzt die Leistungsfähigkeit der Tensor-Recheneinheiten der vierten Generation von Ada Lovelace, scannt die Schichten der neuronalen Netzwerke der Transformer-Architektur auf intelligente Weise und wandelt automatisch zwischen FP8- und FP16-Precisions um, um eine schnellere KI-Leistung zu bieten und Training und Inferenz zu beschleunigen.
Die L40S-GPU ist für den durchgehenden Betrieb in Unternehmens-Rechenzentren optimiert und wurde von NVIDIA entwickelt, gebaut, getestet und unterstützt, um maximale Leistung, Langlebigkeit und Verfügbarkeit zu gewährleisten. Die NVIDIA L40S-GPU erfüllt die neuesten Rechenzentrumsstandards, ist Network Equipment-Building System (NEBS) Level 3-fähig und bietet Secure Boot mit Root of Trust-Technologie, die eine zusätzliche Sicherheitsebene für Rechenzentren bereitstellt.
Die L40S-GPU ermöglicht ultraschnelles Rendering und flüssigere Frameraten mit NVIDIA DLSS 3. Diese bahnbrechende Technologie zur Frame-Generierung nutzt Deep Learning und die neuesten Hardware-Innovationen der Ada Lovelace-Architektur und der L40S-GPU, einschließlich Tensor-Recheneinheiten der vierten Generation und einen Optical Flow Accelerator, um die Rendering-Leistung zu steigern, höhere Frames pro Sekunde (FPS) zu liefern und die Latenz deutlich zu verbessern.
Entwickeln Sie neue Dienste, Einblicke und originelle Inhalte.
Mit AI-, Grafik- und Medienbeschleunigung der nächsten Generation bietet der L40S eine bis zu 5-mal höhere Inferenzleistung als die Vorgängergeneration NVIDIA A40. Mit bahnbrechender Leistung und 48 Gigabyte (GB) Speicherkapazität ist der L40S die ideale Plattform für die Beschleunigung multimodaler generativer AI-Workloads.
Beschleunigen Sie KI-Training und Inferenz-Workloads.
Tensor-Recheneinheiten der vierten Generation mit Unterstützung für FP8 bieten eine außergewöhnliche KI-Rechenleistung, um das Training und die Inferenz von hochmodernen LLM- und generativen KI-Modellen zu beschleunigen.
Steuern Sie kreative Workflows mit hoher Genauigkeit mit NVIDIA RTX™-Grafiken.
Mit RT-Recheneinheiten der dritten Generation, die bis zu zweimal mehr Echtzeit-Raytracing-Leistung als die Vorgängergeneration bieten, um die Erstellung beeindruckender visueller Inhalte und kreativer Workflows mit hoher Genauigkeit zu ermöglichen, vom interaktiven Rendering bis hin zur virtuellen Echtzeitproduktion.
Erstellen und betreiben Sie Metaverse-Anwendungen.
NVIDIA Omniverse™ ermöglicht die Vernetzung, Entwicklung und den Betrieb der nächsten Generation von Anwendungen für die industrielle Digitalisierung. Mit leistungsstarker RTX-Grafik und KI-Funktionen bietet die L40S außergewöhnliche Leistung für Universal Scene Description (OpenUSD)-basierte 3D- und Simulations-Workflows, die auf Omniverse basieren.
Skalierbare Rechenzentrumsinfrastruktur für leistungsstarke AI und Grafik.
In Kombination mit der NVIDIA Spectrum-X-Ethernet-Technologie und der NVIDIA AI Enterprise-Software bietet der NVIDIA OVX L40S Leistung, die ihresgleichen sucht, um die Transformation von Unternehmen mit generativer AI zu beschleunigen.
Stable Diffusion (images per minute)
Gemessene Leistung; NVIDIA L40S Stable Diffusion v2.1, TRT 8.6.1, BS:1, FP16 | Stable Diffusion XL 1.0, TRT 8.6.1, BS:1, FP16
1st Token Latency (ms)
Gemessene Leistung; NVIDIA L40S Llama 2-7B/13B/70B, ISL=2048, OSL=128, BS=1;: FP8.
* Mit geringer Dichte
Einen NVIDIA-Partner kontaktieren.
Mit einem NVIDIA-Produktspezialisten über die beruflichen Anforderungen sprechen.
Für Neuigkeiten zu NVIDIA abonnieren.
NVIDIA-Datenschutzrichtlinie