NVIDIA L40S

Rendimiento de gráficos e IA incomparable para el data center.

Donde Comprar

Encuentre un socio de NVIDIA.

Encontra un Socio

Hoja de Datos | Resumen del Producto | Especificaciones |
Páginas de Rendimiento de Deep Learning

Introducción

Encontra un Socio

La GPU Universal Más Potente

Experimenta un rendimiento sin precedentes en múltiples cargas de trabajo con la GPU NVIDIA L40S. Al combinar una potente computación de IA con los mejores gráficos y aceleración de medios de su clase, la GPU L40S está diseñada para impulsar la próxima generación de cargas de trabajo de data centers, desde la IA generativa y la inferencia y el entrenamiento de grandes modelos de lenguaje (LLM) hasta gráficos 3D, renderizado y video.

NVIDIA y los Fabricantes Globales de Sistemas de Data Centers Potenciarán la IA Generativa y la Digitalización Industrial

Próximamente, Dell, Hewlett Packard Enterprise, Lenovo, Supermicro y otros lanzarán servidores NVIDIA OVX™ con nuevas GPU NVIDIA para acelerar el entrenamiento y la inferencia, así como cargas de trabajo con uso intensivo de gráficos.

Lea el Comunicado de Prensa

Resúmenes

Rendimiento Universal

Rendimiento del Tensor

1,466 TFLOPS¹

Rendimiento del Núcleo RT

212 TFLOPS

Rendimiento de Precisión Simple

91.6 TFLOPS

¹ Las tasas máximas se basan en el clock de refuerzo de la GPU.

Características

Con la Tecnología de la Arquitectura NVIDIA Ada Lovelace

Núcleos Tensor de Cuarta Generación

La compatibilidad de hardware con la dispersión estructural y el formato TF32 optimizado proporcionan mejoras de rendimiento listas para usar para un entrenamiento más rápido de modelos de IA y ciencia de datos. Acelere las capacidades gráficas mejoradas por IA con DLSS para mejorar la resolución con un mejor rendimiento en aplicaciones seleccionadas.

Núcleos RT de Tercera Generación

El rendimiento mejorado y las capacidades simultáneas de ray tracing y sombreado mejoran el rendimiento del ray tracing, acelerando los renderizados para el diseño de productos y los workflows de arquitectura, ingeniería, construcción y operaciones. Vea diseños realistas en acción con desenfoque de movimiento acelerado por hardware e impresionantes animaciones en tiempo real.

Núcleos CUDA

El rendimiento acelerado de punto flotante de precisión simple (FP32) y la eficiencia energética mejorada aumentan significativamente el rendimiento para workflows como el desarrollo de modelos 3D y la simulación de ingeniería asistida por computadora (CAE). Utilice capacidades matemáticas mejoradas de 16 bits (BF16) para cargas de trabajo de precisión mixta.

Transformer Engine

Transformer Engine acelera significativamente el rendimiento de la IA y mejora la utilización de la memoria tanto para el entrenamiento como para la inferencia. Aprovechando la potencia de los Núcleos Tensor de cuarta generación de la arquitectura Ada Lovelace, Transformer Engine escanea de forma inteligente las capas de las redes neuronales de la arquitectura de transformadores y reformula automáticamente entre las precisiones FP8 y FP16 para ofrecer un rendimiento de IA más rápido y acelerar el entrenamiento y la inferencia.

Eficiencia y Seguridad

La GPU L40S está optimizada para operaciones de data centers empresariales las 24 horas del día, los 7 días de la semana, y está diseñada, construida, probada y respaldada por NVIDIA para garantizar el máximo rendimiento, durabilidad y tiempo de actividad. La GPU L40S cumple con los últimos estándares de data centers, está preparada para el nivel 3 del sistema de construcción de equipos de red (NEBS) y cuenta con arranque seguro con tecnología de raíz de confianza, lo que proporciona una capa adicional de seguridad para los data centers.

DLSS 3

La GPU L40S permite un renderizado ultrarrápido y velocidades de fotogramas más fluidas con NVIDIA DLSS 3. Esta innovadora tecnología de generación de fotogramas aprovecha el deep learning y las últimas innovaciones de hardware dentro de la arquitectura Ada Lovelace y la GPU L40S, incluidos los Núcleos Tensor de cuarta generación y un acelerador de flujo óptico, para aumentar el rendimiento de renderizado, ofrecer fotogramas por segundo (FPS) más altos y mejorar significativamente la latencia.

Más Información Sobre la Arquitectura de GPU NVIDIA Ada Lovelace

Cargas de Trabajo

Aceleración de Cargas de Trabajo Múltiples

IA Generativa

Desarrollar Nuevos Servicios, Conocimientos y Contenido Original.

Con capacidades de aceleración de medios, gráficos e IA de última generación, la L40S ofrece un rendimiento de inferencia hasta 5 veces mayor que la NVIDIA A40 de la generación anterior. ‌Con un rendimiento revolucionario y 48 gigabytes (GB) de capacidad de memoria, la L40S es la plataforma ideal para acelerar cargas de trabajo de IA generativa multimodal.

Más Información Sobre la IA Generativa

Entrenamiento e Inferencia de LLM

Acelere las Cargas de Trabajo de Entrenamiento e Inferencia de IA.

Los Núcleos Tensor de cuarta generación compatibles con FP8 ofrecen un rendimiento de computación de IA excepcional para acelerar el entrenamiento y la inferencia de modelos de IA generativa y LLM de última generación.

Explora los Beneficios de la Inferencia de IA de NVIDIA

Renderizado y Gráficos 3D

Potencia los Workflows Creativos de Alta Fidelidad con los Gráficos NVIDIA RTX™.

Con Núcleos RT de tercera generación que ofrecen hasta 2 veces el rendimiento de ray tracing en tiempo real de la generación anterior para impulsar la creación de contenido visual impresionante y workflows creativos de alta fidelidad, desde el renderizado interactivo hasta la producción virtual en tiempo real.

Más Información Sobre la Tecnología NVIDIA RTX

NVIDIA Omniverse

Crear y Operar Aplicaciones de Metaverso

NVIDIA Omniverse™ permite conectar, desarrollar y operar la próxima ola de aplicaciones de digitalización industrial. Con potentes gráficos RTX y capacidades de IA, L40S ofrece un rendimiento excepcional para workflows de simulación y 3D basados en Universal Scene Description (OpenUSD) basados en Omniverse.

Más Información Sobre NVIDIA Omniverse

NVIDIA OVX L40S

Infraestructura de Data Center Escalable para Gráficos e IA de Alto Rendimiento.

Combinado con la tecnología NVIDIA Spectrum-X Ethernet y el software NVIDIA AI Enterprise , NVIDIA OVX L40S ofrece un rendimiento líder en la industria para acelerar la transformación empresarial con IA generativa.

Más Información

Rendimiento

Rendimiento Innovador

IA Generativa de Imágenes

Stable Diffusion (images per minute)

Rendimiento medido; Nvidia L40S
Difusión estable v2.1, TRT 8.6.1, BS:1, FP16 | Difusión estable XL 1.0, TRT 8.6.1, BS:1, FP16

Inferencia de los Grandes Modelos de Lenguaje (LLM)

1st Token Latency (ms)

Rendimiento medido; Nvidia L40S
Llama 2-7B/13B/70B, ISL=2048, OSL=128, BS=1; 8PM.

Especificaciones

GPU NVIDIA L40S

FP32	91.6 teraFLOPS
Núcleo Tensor TF32	366 teraFLOPS*
FP16	733 teraFLOPS*
FP8	1,466 teraFLOPS*
Rendimiento del Núcleo RT	212 teraFLOPS
Consumo Máximo de Energía	350W
*Con dispersión

Ver Especificaciones Completas Vea la Ficha Técnica

Revise el Rendimiento Más Reciente de la GPU en Aplicaciones HPC

Empezar

¿Listo para Comprar?

Hable con un socio de NVIDIA.

Encuentra un Socio

¿Necesita Ayuda para Seleccionar el Producto o Socio Adecuado?

Habla con un especialista en productos NVIDIA sobre tus necesidades profesionales.

Contáctenos

Manténgase al Día Sobre las Últimas Noticias

Regístrate para recibir noticias de NVIDIA.

Mantente Informado

Arquitectura de GPU	Arquitectura NVIDIA Ada Lovelace
Memoria de la GPU	48GB GDDR6 con ECC
Ancho de Banda de Memoria	864GB/s
Interfaz de Interconexión	PCIe Gen4 x16: 64GB/s bidireccional
Núcleos CUDA® Basados en la Arquitectura NVIDIA Ada Lovelace	18,176
Núcleos RT de Tercera Generación de NVIDIA	142
Núcleos Tensor de Cuarta Generación de NVIDIA	568
Rendimiento de TFLOPS en Núcleo RT	212
TFLOPS FP32	91.6
TFLOPS de Núcleo Tensor TF32	183 I 366*
TFLOPS de Núcleo Tensor BFLOAT16	362.05 I 733*
Núcleo Tensor FP16	362.05 I 733*
Núcleo Tensor FP8	733 I 1,466*
Pico INT8 Tensor TOPS Pico INT4 Tensor TOPS	733 I 1,466* 733 I 1,466*
Formato	4.4" (H) x 10.5" (L), dual slot
Puertos de Pantalla	4x Puertos de Pantalla 1.4a
Consumo Máximo de Energía	350W
Conector de Alimentación	16 pines
Termal	Pasivo
Compatibilidad con Software de GPU virtual (vGPU)	Sí
Perfiles de vGPU Compatibles	Consulte la guía de licencias de GPU virtual
NVENC I NVDEC	3x l 3x (incluye codificación y decodificación AV1)
Arranque Seguro con Raíz de Confianza	Sí
Listo para NEBS	Nivel 3
Compatibilidad con GPU Multiinstancia (MIG)	No
Compatibilidad con NVIDIA® NVLink®	No
*Con dispersión