Rendimiento de gráficos e IA incomparable para el data center.
Encuentre un socio de NVIDIA.
Hoja de Datos | Resumen del Producto | Especificaciones | Páginas de Rendimiento de Deep Learning
Experimenta un rendimiento sin precedentes en múltiples cargas de trabajo con la GPU NVIDIA L40S. Al combinar una potente computación de IA con los mejores gráficos y aceleración de medios de su clase, la GPU L40S está diseñada para impulsar la próxima generación de cargas de trabajo de data centers, desde la IA generativa y la inferencia y el entrenamiento de grandes modelos de lenguaje (LLM) hasta gráficos 3D, renderizado y video.
Próximamente, Dell, Hewlett Packard Enterprise, Lenovo, Supermicro y otros lanzarán servidores NVIDIA OVX™ con nuevas GPU NVIDIA para acelerar el entrenamiento y la inferencia, así como cargas de trabajo con uso intensivo de gráficos.
1,466 TFLOPS¹
212 TFLOPS
91.6 TFLOPS
1 Las tasas máximas se basan en el clock de refuerzo de la GPU.
La compatibilidad de hardware con la dispersión estructural y el formato TF32 optimizado proporcionan mejoras de rendimiento listas para usar para un entrenamiento más rápido de modelos de IA y ciencia de datos. Acelere las capacidades gráficas mejoradas por IA con DLSS para mejorar la resolución con un mejor rendimiento en aplicaciones seleccionadas.
El rendimiento mejorado y las capacidades simultáneas de ray tracing y sombreado mejoran el rendimiento del ray tracing, acelerando los renderizados para el diseño de productos y los workflows de arquitectura, ingeniería, construcción y operaciones. Vea diseños realistas en acción con desenfoque de movimiento acelerado por hardware e impresionantes animaciones en tiempo real.
El rendimiento acelerado de punto flotante de precisión simple (FP32) y la eficiencia energética mejorada aumentan significativamente el rendimiento para workflows como el desarrollo de modelos 3D y la simulación de ingeniería asistida por computadora (CAE). Utilice capacidades matemáticas mejoradas de 16 bits (BF16) para cargas de trabajo de precisión mixta.
Transformer Engine acelera significativamente el rendimiento de la IA y mejora la utilización de la memoria tanto para el entrenamiento como para la inferencia. Aprovechando la potencia de los Núcleos Tensor de cuarta generación de la arquitectura Ada Lovelace, Transformer Engine escanea de forma inteligente las capas de las redes neuronales de la arquitectura de transformadores y reformula automáticamente entre las precisiones FP8 y FP16 para ofrecer un rendimiento de IA más rápido y acelerar el entrenamiento y la inferencia.
La GPU L40S está optimizada para operaciones de data centers empresariales las 24 horas del día, los 7 días de la semana, y está diseñada, construida, probada y respaldada por NVIDIA para garantizar el máximo rendimiento, durabilidad y tiempo de actividad. La GPU L40S cumple con los últimos estándares de data centers, está preparada para el nivel 3 del sistema de construcción de equipos de red (NEBS) y cuenta con arranque seguro con tecnología de raíz de confianza, lo que proporciona una capa adicional de seguridad para los data centers.
La GPU L40S permite un renderizado ultrarrápido y velocidades de fotogramas más fluidas con NVIDIA DLSS 3. Esta innovadora tecnología de generación de fotogramas aprovecha el deep learning y las últimas innovaciones de hardware dentro de la arquitectura Ada Lovelace y la GPU L40S, incluidos los Núcleos Tensor de cuarta generación y un acelerador de flujo óptico, para aumentar el rendimiento de renderizado, ofrecer fotogramas por segundo (FPS) más altos y mejorar significativamente la latencia.
Desarrollar Nuevos Servicios, Conocimientos y Contenido Original.
Con capacidades de aceleración de medios, gráficos e IA de última generación, la L40S ofrece un rendimiento de inferencia hasta 5 veces mayor que la NVIDIA A40 de la generación anterior. Con un rendimiento revolucionario y 48 gigabytes (GB) de capacidad de memoria, la L40S es la plataforma ideal para acelerar cargas de trabajo de IA generativa multimodal.
Acelere las Cargas de Trabajo de Entrenamiento e Inferencia de IA.
Los Núcleos Tensor de cuarta generación compatibles con FP8 ofrecen un rendimiento de computación de IA excepcional para acelerar el entrenamiento y la inferencia de modelos de IA generativa y LLM de última generación.
Potencia los Workflows Creativos de Alta Fidelidad con los Gráficos NVIDIA RTX™.
Con Núcleos RT de tercera generación que ofrecen hasta 2 veces el rendimiento de ray tracing en tiempo real de la generación anterior para impulsar la creación de contenido visual impresionante y workflows creativos de alta fidelidad, desde el renderizado interactivo hasta la producción virtual en tiempo real.
Crear y Operar Aplicaciones de Metaverso
NVIDIA Omniverse™ permite conectar, desarrollar y operar la próxima ola de aplicaciones de digitalización industrial. Con potentes gráficos RTX y capacidades de IA, L40S ofrece un rendimiento excepcional para workflows de simulación y 3D basados en Universal Scene Description (OpenUSD) basados en Omniverse.
Infraestructura de Data Center Escalable para Gráficos e IA de Alto Rendimiento.
Combinado con la tecnología NVIDIA Spectrum-X Ethernet y el software NVIDIA AI Enterprise , NVIDIA OVX L40S ofrece un rendimiento líder en la industria para acelerar la transformación empresarial con IA generativa.
Stable Diffusion (images per minute)
Rendimiento medido; Nvidia L40S Difusión estable v2.1, TRT 8.6.1, BS:1, FP16 | Difusión estable XL 1.0, TRT 8.6.1, BS:1, FP16
1st Token Latency (ms)
Rendimiento medido; Nvidia L40S Llama 2-7B/13B/70B, ISL=2048, OSL=128, BS=1; 8PM.
*Con dispersión
Hable con un socio de NVIDIA.
Habla con un especialista en productos NVIDIA sobre tus necesidades profesionales.
Regístrate para recibir noticias de NVIDIA.
Política de Privacidad de NVIDIA