NVIDIA L40S

Prestazioni IA e grafiche senza pari per il data center.

Dove acquistare

Trova un partner NVIDIA.

Trova un partner

Scheda tecnica | Sintesi del prodotto | Specifiche |
Deep Learning Performance Pages

Introduzione

Trova un partner

La GPU universale più potente

Sperimenta prestazioni straordinarie su carichi di lavoro multipli con la GPU NVIDIA L40S. Combinando la potenza del calcolo basato su IA con grafica e accelerazione multimediali all'avanguardia, la GPU L40S è progettata per alimentare la nuova generazione di carichi di lavoro del data center, dall'IA generativa all'inferenza per modelli linguistici di grandi dimensioni (LLM), fino alla grafica 3D, al rendering e al video.

NVIDIA e i produttori globali di sistemi per data center potenziano l'IA generativa e la digitalizzazione industriale

I server NVIDIA OVX™, con le nuove GPU NVIDIA per accelerare il training e l'inferenza, i carichi di lavoro ad alta intensità grafica, saranno presto disponibili presso Dell, Hewlett Packard Enterprise, Lenovo, Supermicro e altri produttori.

Leggi il comunicato stampa

In evidenza

Prestazioni universali

Prestazioni Tensor

1.466 TFLOPS¹

Prestazioni RT Core

212 TFLOPS

Prestazioni in precisione singola

91.6 TFLOPS

¹ Velocità di picco basate sul boost clock della GPU.

Caratteristiche

Basata su architettura NVIDIA Ada Lovelace

Tensor Core di quarta generazione

Il supporto hardware per la densità strutturale e il formato TF32 ottimizzato garantiscono prestazioni più elevate fin da subito, per accelerare il training dei modelli di IA e scienza dei dati. Accelera le funzionalità grafiche basate su IA con DLSS per aumentare la risoluzione con prestazioni superiori in applicazioni selezionate.

RT Core di terza generazione

Il throughput migliorato e le funzionalità simultanee di ray-tracing e shading aumentano le prestazioni del ray-tracing, accelerando il rendering per i flussi di lavoro di design dei prodotti, ingegneria ed edilizia. Guarda i progetti realistici in azione con il motion blur accelerato dall'hardware e animazioni straordinarie in tempo reale.

CUDA Core

Il throughput in virgola mobile a precisione singola (FP32) accelerato e l'aumentata efficienza energetica offrono miglioramenti significativi delle prestazioni per flussi di lavoro come lo sviluppo di modelli 3D e la simulazione CAE. Supporta funzionalità matematiche avanzate a 16 bit (BF16) per carichi di lavoro a precisione mista.

Transformer Engine

Transformer Engine accelera significativamente le prestazioni IA e migliora l'utilizzo della memoria per training e inferenza. Sfruttando la potenza dei Tensor Core di quarta generazione Ada Lovelace, Transformer Engine analizza in modo intelligente i livelli delle reti neurali dell'architettura Transformer ed esegue automaticamente il recast tra precisioni FP8 e FP16, per fornire prestazioni IA più veloci e accelerare training e inferenza.

Efficienza e sicurezza

NVIDIA L40S è ottimizzata per operazioni di data center aziendali 24 ore su 24, 7 giorni su 7 ed è progettata, costruita, testata e supportata da NVIDIA per garantire massime prestazioni, durata e uptime. La GPU L40S soddisfa i più recenti standard per data center, è compatibile con NEBS Level 3 e include l'avvio sicuro con tecnologia Root of Trust, per garantire un ulteriore livello di sicurezza al data center.

DLSS 3

La GPU L40S consente un rendering ultra veloce e frame rate più fluidi con NVIDIA DLSS 3. Questa tecnologia di generazione di frame all'avanguardia sfrutta il deep learning e le più recenti innovazioni hardware all'interno dell'architettura Ada Lovelace e della GPU L40S, tra cui Tensor Core di quarta generazione e Optical Flow Accelerator, per aumentare le prestazioni di rendering, fornire frame per secondo (FPS) più alti e migliorare significativamente la latenza.

Scopri di più su sull'architettura per GPU NVIDIA Ada Lovelace

Workloads

Accelerazione per carichi di lavoro multipli

IA generativa

Sviluppa nuovi servizi, approfondimenti e contenuti originali.

Con funzionalità IA, grafica e accelerazione multimediale di nuova generazione, L40S offre prestazioni di inferenza fino a 5 volte superiori rispetto alla NVIDIA A40 di precedente generazione. ‌Con prestazioni all'avanguardia e 48 gigabyte (GB) di capacità di memoria, L40S è la piattaforma ideale per accelerare i carichi di lavoro di IA generativa multimodali.

Scopri di più sull'IA generativa

Training e inferenza di modelli LLM

Accelera i carichi di lavoro di training e inferenza con IA.

I Tensor Core di quarta generazione con supporto per FP8 offrono prestazioni di calcolo IA eccezionali per accelerare il training e l'inferenza di modelli LLM e IA generativa all'avanguardia.

Esplora i vantaggi dell'inferenza con NVIDIA AI

Rendering e grafica 3D

Flussi di lavoro creativi ad alta fedeltà con le schede grafiche NVIDIA RTX™.

RT Core di terza generazione che offrono prestazioni di ray-tracing in tempo reale fino a 2 volte superiori rispetto alla generazione precedente per potenziare la creazione di contenuti visivi straordinari e flussi di lavoro creativi ad alta fedeltà, dal rendering interattivo alla produzione virtuale in tempo reale.

Scopri di più sulla tecnologia NVIDIA RTX

NVIDIA Omniverse

Crea e gestisci applicazioni nel metaverso.

NVIDIA Omniverse™ permette di collegare, sviluppare e gestire la nuova ondata di applicazioni di digitalizzazione industriale. Con le potenti funzionalità grafiche e IA di RTX, la L40S offre prestazioni eccezionali per flussi di lavoro 3D e simulazione basati su Universal Scene Description (OpenUSD) costruiti su Omniverse.

Scopri di più su NVIDIA Omniverse

NVIDIA OVX L40S

Infrastruttura per data center scalabile per IA e grafica ad alte prestazioni.

Insieme alla tecnologia Ethernet NVIDIA Spectrum-X e al software NVIDIA AI Enterprise, NVIDIA OVX L40S offre prestazioni leader di settore per accelerare la trasformazione aziendale con l'IA generativa.

Scopri di più

Prestazioni

Prestazioni all'avanguardia

Immagine IA generativa

Stable Diffusion (images per minute)

Prestazioni misurate; NVIDIA L40S
Stable Diffusion v2.1, TRT 8.6.1, BS:1, FP16 | Stable Diffusion XL 1.0, TRT 8.6.1, BS:1, FP16

Modelli linguistici di grandi dimensioni (LLM)

1st Token Latency (ms)

Prestazioni misurate; NVIDIA L40S
Llama 2-7B/13B/70B, ISL=2048, OSL=128, BS=1;: FP8.

Specifiche

GPU NVIDIA L40S

FP32	91.6 teraFLOPS
TF32 Tensor Core	366 teraFLOPS*
FP16	733 teraFLOPS*
FP8	1,466 teraFLOPS*
Prestazioni RT Core	212 teraFLOPS
Max consumo energetico	350 W
* Con densità

Vedi le specifiche complete Vedi la scheda tecnica

Scopri le prestazioni più recenti della GPU su applicazioni HPC

Inizia

Pronto per acquistare?

Parla con un partner NVIDIA.

Trova un partner

Hai bisogno di aiuto per scegliere il prodotto o il partner giusto?

Parla con uno specialista di prodotti NVIDIA delle tue esigenze professionali.

Contattaci

Resta aggiornato con le notizie più recenti

Iscriviti per ricevere le ultime notizie da NVIDIA.

Resta informato

Architettura GPU	Architettura NVIDIA Ada Lovelace
Memoria della GPU	GDDR6 da 48 GB con ECC
Banda di memoria	864 GB/s
Interfaccia di interconnessione	PCIe Gen4 x16: 64 GB/s bidirezionale
CUDA® Core basati su architettura NVIDIA Ada Lovelace	18.176
NVIDIA RT Core di terza generazione	142
NVIDIA Tensor Core di quarta generazione	568
Prestazioni RT Core TFLOPS	212
FP32 TFLOPS	91.6
TF32 Tensor Core TFLOPS	183 I 366*
BFLOAT16 Tensor Core TFLOPS	362.05 I 733*
FP16 Tensor Core	362.05 I 733*
FP8 Tensor Core	733 I 1.466*
Picco INT8 Tensor TOPS Picco INT4 Tensor TOPS	733 I 1.466* 733 I 1.466*
Fattore di forma	Doppio slot 4,4" (H) x 10,5" (L)
Display Port	4 DisplayPort 1.4a
Max consumo energetico	350 W
Connettore di alimentazione	16 pin
Termica	Passiva
Supporto software Virtual GPU (vGPU)	Sì
Profili vGPU supportati	Consulta la guida alle licenze per le GPU virtuali
NVENC I NVDEC	3 \| 3 (include codifica e decodifica AV1)
Avvio sicuro con root of trust	Sì
Compatibilità con NEBS	Livello 3
Supporto per Multi-Instance GPU (MIG)	No
Supporto per NVIDIA® NVLink®	No
*Con densità

NVIDIA L40S

Dove acquistare

La GPU universale più potente

NVIDIA e i produttori globali di sistemi per data center potenziano l'IA generativa e la digitalizzazione industriale

In evidenza

Prestazioni universali

Prestazioni Tensor

Prestazioni RT Core

Prestazioni in precisione singola

Caratteristiche

Basata su architettura NVIDIA Ada Lovelace

Tensor Core di quarta generazione

RT Core di terza generazione

CUDA Core

Transformer Engine

Efficienza e sicurezza

DLSS 3

Workloads

Accelerazione per carichi di lavoro multipli

IA generativa

Training e inferenza di modelli LLM

Rendering e grafica 3D

NVIDIA Omniverse

NVIDIA OVX L40S

Prestazioni

Prestazioni all'avanguardia

Immagine IA generativa

Modelli linguistici di grandi dimensioni (LLM)

Specifiche

GPU NVIDIA L40S

Inizia

Pronto per acquistare?

Hai bisogno di aiuto per scegliere il prodotto o il partner giusto?

Resta aggiornato con le notizie più recenti

Iscriviti per essere avvisato della disponibilità

Specifiche della GPU NVIDIA L40S