Desempenho incomparável de IA e gráficos para o data center.
Encontre um Parceiro NVIDIA.
Ficha Técnica | Resumo do Produto | Especificações | Páginas de Desempenho de Deep Learning
Experimente um desempenho inovador de várias cargas de trabalho com a GPU NVIDIA L40S. Combinando computação de IA poderosa com os melhores gráficos e aceleração de mídia da categoria, a GPU L40S foi criada para impulsionar a próxima geração de cargas de trabalho de data center, desde IA generativa e inferência e treinamento de grandes modelos de linguagem (LLM) até gráficos 3D, renderização e vídeo.
Os Servidores NVIDIA OVX™ com novas GPUs NVIDIA para acelerar treinamento e inferência, bem como cargas de trabalho com uso intensivo de gráficos, serão lançados em breve pela Dell, Hewlett Packard Enterprise, Lenovo, Supermicro e outros.
1,466 TFLOPS¹
212 TFLOPS
91.6 TFLOPS
1 As taxas de pico são baseadas no clock de aumento da GPU.
O suporte de hardware para esparsidade estrutural e o formato TF32 otimizado fornecem ganhos de desempenho prontos para uso para treinamento mais rápido de modelos de IA e ciência de dados. Acelere os recursos gráficos aprimorados por IA com DLSS para aumentar a resolução com melhor desempenho em aplicativos selecionados.
A taxa de transferência aprimorada e os recursos simultâneos de ray-tracing e sombreamento melhoram o desempenho do ray-tracing, acelerando as renderizações para projetos e workflows de design de produtos e em arquitetura, engenharia, construção e operações (AECO). Veja designs realistas em ação com desfoque de movimento acelerado por hardware e animações impressionantes em tempo real.
A taxa de transferência acelerada de ponto flutuante de precisão única (FP32) e a eficiência energética aprimorada aumentam significativamente o desempenho para workflows como desenvolvimento de modelos 3D e simulação de engenharia auxiliada por computador (CAE). Use recursos matemáticos aprimorados de 16 bits (BF16) para cargas de trabalho de precisão mista.
O Transformer Engine acelera significativamente o desempenho da IA e melhora a utilização da memória para treinamento e inferência. Aproveitando o poder dos Núcleos Tensor de quarta geração da arquitwtura Ada Lovelace, o Transformer Engine escaneia de forma inteligente as camadas das redes neurais da arquitetura Transformer e reformula automaticamente entre as precisões FP8 e FP16 para oferecer desempenho de IA mais rápido e acelerar o treinamento e a inferência.
A GPU L40S é otimizada para operações de data center corporativo em tempo integral e projetada, construída, testada e suportada pela NVIDIA para garantir o máximo desempenho, durabilidade e tempo de atividade. A GPU L40S atende aos mais recentes padrões de data center, está pronta para o NEBS (Network Equipment-Building System) Nível 3 e possui inicialização segura com tecnologia raiz de confiança, fornecendo uma camada adicional de segurança para data centers.
A GPU L40S permite renderização ultrarrápida e taxas de quadros mais suaves com o NVIDIA DLSS 3. Essa tecnologia inovadora de geração de quadros aproveita o deep learning e as mais recentes inovações de hardware dentro da arquitetura Ada Lovelace e da GPU L40S, incluindo Núcleos Tensor de quarta geração e um acelerador de fluxo óptico, para aumentar o desempenho de renderização, fornecer quadros por segundo (FPS) mais altos e melhorar significativamente a latência.
Desenvolva Novos Serviços, Insights e Conteúdo Original.
Com recursos de IA, gráficos e aceleração de mídia de última geração, o L40S oferece desempenho de inferência até 5 vezes maior do que a NVIDIA A40 da geração anterior. Com desempenho inovador e 48 gigabytes (GB) de capacidade de memória, a L40S é a plataforma ideal para acelerar cargas de trabalho de IA generativa multimodal.
Acelere o Treinamento de IA e as Cargas de Trabalho de Inferência.
Os Núcleos Tensor de quarta geração com suporte para FP8 oferecem desempenho excepcional de computação de IA para acelerar o treinamento e a inferência de modelos de LLM e IA generativa de última geração.
Potencialize Workflows Criativos de Alta Fidelidade com Gráficos NVIDIA RTX™.
Com Núcleos RT de terceira geração que oferecem até o dobro do desempenho de ray-tracing em tempo real da geração anterior para impulsionar a criação de conteúdo visual impressionante e workflows criativos de alta fidelidade, desde renderização interativa até produção virtual em tempo real.
Crie e Opere Aplicações do Metaverso.
O NVIDIA Omniverse™ torna possível conectar, desenvolver e operar a próxima onda de aplicações de digitalização industrial. Com poderosos gráficos RTX e recursos de IA, a L40S oferece desempenho excepcional para workflows 3D e de simulação baseados em Universal Scene Description (OpenUSD) construídos no Omniverse.
Infraestrutura Escalonável de Data Center para IA e Gráficos de Alto Desempenho.
Combinado com a tecnologia NVIDIA Spectrum-X Ethernet e o software NVIDIA AI Enterprise , a NVIDIA OVX L40S oferece desempenho líder do setor para acelerar a transformação empresarial com IA generativa.
Stable Diffusion (images per minute)
Desempenho medido; NVIDIA L40S Difusão Estável v2.1, TRT 8.6.1, BS:1, FP16 | Difusão Estável XL 1.0, TRT 8.6.1, BS:1, FP16
1st Token Latency (ms)
Desempenho medido; NVIDIA L40S Lhama 2-7B/13B/70B, ISL=2048, OSL=128, BS=1; 8º PQ.
*Com dispersão
Fale com um parceiro NVIDIA.
Fale com um especialista em produtos NVIDIA sobre suas necessidades profissionais.
Inscreva-se para receber novidades da NVIDIA.
Política de Privacidade da NVIDIA