憑藉新一代 AI、圖形和媒體加速功能,L40S 的推論性能比上一代 NVIDIA A40 高出 5 倍。 憑藉突破性的效能和 48 GB 的記憶體容量,L40S 是加速多模式產生 AI 工作負載的理想平台。
透過 NVIDIA L40S GPU 體驗突破性的多工作負載效能。L40S GPU 結合強大的人工智慧運算與一流的繪圖技術和媒體加速,專為支援新一代資料中心工作負載而打造,從生成式人工智慧和大型語言模型 (LLM) 推論與訓練,到 3D 繪圖、渲染和影片。
1,466 兆次浮點運算¹
212 兆次浮點運算
91.6 兆次浮點運算
1 最高速率是以 GPU 加速時脈為準。
開發新的服務、見解和原創內容。
加速人工智慧訓練和推論工作負載。
使用 NVIDIA RTX™ 繪圖技術支援高擬真度的創作工作流程。
建立並使用元宇宙應用程式。
用於高效能人工智慧和圖形的可擴展資料中心基礎架構。
Stable Diffusion (images per minute)
效能量測;NVIDIA L40S
Stable Diffusion v2.1, TRT 8.6.1, BS:1, FP16 | Stable Diffusion XL 1.0, TRT 8.6.1, BS:1, FP16
1st Token Latency (ms)
效能量測;NVIDIA L40S
Llama 2-7B/13B/70B, ISL=2048, OSL=128, BS=1;: FP8.
FP32 | 91.6 兆次浮點運算 |
TF32 Tensor 核心 | 366 兆次浮點運算* |
FP16 | 733 兆次浮點運算* |
FP8 | 1,466 兆次浮點運算* |
RT 核心效能 | 212 兆次浮點運算 |
最大功耗 | 350W |
* 具有稀疏性 |