Prestazioni IA e grafiche senza pari per il data center.
Trova un partner NVIDIA.
Scheda tecnica | Sintesi del prodotto | Specifiche | Deep Learning Performance Pages
Sperimenta prestazioni straordinarie su carichi di lavoro multipli con la GPU NVIDIA L40S. Combinando la potenza del calcolo basato su IA con grafica e accelerazione multimediali all'avanguardia, la GPU L40S è progettata per alimentare la nuova generazione di carichi di lavoro del data center, dall'IA generativa all'inferenza per modelli linguistici di grandi dimensioni (LLM), fino alla grafica 3D, al rendering e al video.
I server NVIDIA OVX™, con le nuove GPU NVIDIA per accelerare il training e l'inferenza, i carichi di lavoro ad alta intensità grafica, saranno presto disponibili presso Dell, Hewlett Packard Enterprise, Lenovo, Supermicro e altri produttori.
1.466 TFLOPS¹
212 TFLOPS
91.6 TFLOPS
1 Velocità di picco basate sul boost clock della GPU.
Il supporto hardware per la densità strutturale e il formato TF32 ottimizzato garantiscono prestazioni più elevate fin da subito, per accelerare il training dei modelli di IA e scienza dei dati. Accelera le funzionalità grafiche basate su IA con DLSS per aumentare la risoluzione con prestazioni superiori in applicazioni selezionate.
Il throughput migliorato e le funzionalità simultanee di ray-tracing e shading aumentano le prestazioni del ray-tracing, accelerando il rendering per i flussi di lavoro di design dei prodotti, ingegneria ed edilizia. Guarda i progetti realistici in azione con il motion blur accelerato dall'hardware e animazioni straordinarie in tempo reale.
Il throughput in virgola mobile a precisione singola (FP32) accelerato e l'aumentata efficienza energetica offrono miglioramenti significativi delle prestazioni per flussi di lavoro come lo sviluppo di modelli 3D e la simulazione CAE. Supporta funzionalità matematiche avanzate a 16 bit (BF16) per carichi di lavoro a precisione mista.
Transformer Engine accelera significativamente le prestazioni IA e migliora l'utilizzo della memoria per training e inferenza. Sfruttando la potenza dei Tensor Core di quarta generazione Ada Lovelace, Transformer Engine analizza in modo intelligente i livelli delle reti neurali dell'architettura Transformer ed esegue automaticamente il recast tra precisioni FP8 e FP16, per fornire prestazioni IA più veloci e accelerare training e inferenza.
NVIDIA L40S è ottimizzata per operazioni di data center aziendali 24 ore su 24, 7 giorni su 7 ed è progettata, costruita, testata e supportata da NVIDIA per garantire massime prestazioni, durata e uptime. La GPU L40S soddisfa i più recenti standard per data center, è compatibile con NEBS Level 3 e include l'avvio sicuro con tecnologia Root of Trust, per garantire un ulteriore livello di sicurezza al data center.
La GPU L40S consente un rendering ultra veloce e frame rate più fluidi con NVIDIA DLSS 3. Questa tecnologia di generazione di frame all'avanguardia sfrutta il deep learning e le più recenti innovazioni hardware all'interno dell'architettura Ada Lovelace e della GPU L40S, tra cui Tensor Core di quarta generazione e Optical Flow Accelerator, per aumentare le prestazioni di rendering, fornire frame per secondo (FPS) più alti e migliorare significativamente la latenza.
Sviluppa nuovi servizi, approfondimenti e contenuti originali.
Con funzionalità IA, grafica e accelerazione multimediale di nuova generazione, L40S offre prestazioni di inferenza fino a 5 volte superiori rispetto alla NVIDIA A40 di precedente generazione. Con prestazioni all'avanguardia e 48 gigabyte (GB) di capacità di memoria, L40S è la piattaforma ideale per accelerare i carichi di lavoro di IA generativa multimodali.
Accelera i carichi di lavoro di training e inferenza con IA.
I Tensor Core di quarta generazione con supporto per FP8 offrono prestazioni di calcolo IA eccezionali per accelerare il training e l'inferenza di modelli LLM e IA generativa all'avanguardia.
Flussi di lavoro creativi ad alta fedeltà con le schede grafiche NVIDIA RTX™.
RT Core di terza generazione che offrono prestazioni di ray-tracing in tempo reale fino a 2 volte superiori rispetto alla generazione precedente per potenziare la creazione di contenuti visivi straordinari e flussi di lavoro creativi ad alta fedeltà, dal rendering interattivo alla produzione virtuale in tempo reale.
Crea e gestisci applicazioni nel metaverso.
NVIDIA Omniverse™ permette di collegare, sviluppare e gestire la nuova ondata di applicazioni di digitalizzazione industriale. Con le potenti funzionalità grafiche e IA di RTX, la L40S offre prestazioni eccezionali per flussi di lavoro 3D e simulazione basati su Universal Scene Description (OpenUSD) costruiti su Omniverse.
Infrastruttura per data center scalabile per IA e grafica ad alte prestazioni.
Insieme alla tecnologia Ethernet NVIDIA Spectrum-X e al software NVIDIA AI Enterprise, NVIDIA OVX L40S offre prestazioni leader di settore per accelerare la trasformazione aziendale con l'IA generativa.
Stable Diffusion (images per minute)
Prestazioni misurate; NVIDIA L40S Stable Diffusion v2.1, TRT 8.6.1, BS:1, FP16 | Stable Diffusion XL 1.0, TRT 8.6.1, BS:1, FP16
1st Token Latency (ms)
Prestazioni misurate; NVIDIA L40S Llama 2-7B/13B/70B, ISL=2048, OSL=128, BS=1;: FP8.
* Con densità
Parla con un partner NVIDIA.
Parla con uno specialista di prodotti NVIDIA delle tue esigenze professionali.
Iscriviti per ricevere le ultime notizie da NVIDIA.
Informativa sulla privacy NVIDIA
*Con densità