NVIDIA L40S

專為資料中心提供前所未有的人工智慧和繪圖效能

如何購買

尋找 NVIDIA 合作夥伴。

尋找合作夥伴

產品資料表 | 產品簡介 | 規格
 深度學習效能網頁

簡介

合作夥伴

最強大的通用 GPU

透過 NVIDIA L40S GPU 體驗突破性的多工作負載效能。L40S GPU 結合強大的人工智慧運算與一流的繪圖技術和媒體加速，專為支援新一代資料中心工作負載而打造，從生成式人工智慧和大型語言模型 (LLM) 推論與訓練，到 3D 繪圖、渲染和影片。

NVIDIA 與全球資料中心系統製造商共同推動生成式 AI 和工業數位化

戴爾、慧與科技、聯想、美高微等公司即將推出採用新型 NVIDIA GPU 的 NVIDIA OVX™ 伺服器，以加速訓練和推理以及圖像密集型工作負載。

閱讀新聞稿

重點

通用效能

Tensor 效能

1,466 兆次浮點運算¹

RT 核心效能

212 兆次浮點運算

單精度效能

91.6 兆次浮點運算

¹ 最高速率是以 GPU 加速時脈為準。

功能

採用 NVIDIA Ada Lovelace 架構

第四代 Tensor 核心

為結構化稀疏性和最佳化 TF32 格式提供硬體支援，實現優異的即時效能提升，加速人工智慧和資料科學模型訓練。運用 DLSS 加速人工智慧強化的繪圖運算功能，為特定應用程式升級解析度，提供更優異的效能。

第三代 RT 核心

經強化的輸送量和並行的光線追蹤與著色功能，可提升光線追蹤效能，並加速產品設計與建築、工程和營造工作流程的渲染器。透過硬體加速的動態模糊與令人驚豔的即時動畫，呈現栩栩如生的動態設計。

CUDA 核心

經過加速的單精度浮點 (FP32) 輸送量和提升的能源效率，大幅改善 3D 模型開發和電腦輔助工程 (CAE) 模擬等工作流程的效能。運用強化的 16 位元數學功能 (BF16)，可進行混合精度工作負載。

Transformer Engine

Transformer Engine 可大幅加速人工智慧效能，並改善訓練和推論的記憶體使用率。Transformer Engine 運用 Ada Lovelace 第四代 Tensor 核心的強大功能，以智慧方式掃描 Transformer 架構神經網路層，並自動在 FP8 和 FP16 精度之間重新轉換，以提供更快速的人工智慧效能，並提升訓練和推論的速度。

效率及安全性

L40S GPU 專為 24 小時全年無休的企業資料中心營運量身打造而進行最佳化，並由 NVIDIA 設計、打造、測試與支援，確保能提供極致效能、最佳耐用性與最長運作時間。L40S GPU 符合最新的資料中心標準，可支援網路設備建構系統 (NEBS) Level 3，並具備安全開機與信任根技術，為資料中心多增加一層安全保護。

DLSS 3

L40S GPU 可透過 NVIDIA DLSS 3 實現超高速渲染和更流暢的畫面播放速率。這項突破性的畫面產生技術在 Ada Lovelace 架構和 L40S GPU 中，運用深度學習和最新的硬體創新技術，包括第四代 Tensor 核心和光流技術加速器，以提升渲染效能、提供更高的每秒顯示畫面數 (FPS)，並大幅改善延遲狀況。

深入瞭解 NVIDIA Ada Lovelace GPU 架構

工作負載

多工作負載加速

生成式人工智慧

開發新的服務、見解和原創內容。

憑藉新一代 AI、圖形和媒體加速功能，L40S 的推論性能比上一代 NVIDIA A40 高出 5 倍。 ‌憑藉突破性的效能和 48 GB 的記憶體容量，L40S 是加速多模式產生 AI 工作負載的理想平台。

深入瞭解生成式人工智慧

大型語言模型訓練與推論

加速人工智慧訓練和推論工作負載。

第四代 Tensor 核心支援 FP8，可提供卓越的人工智慧運算效能，加速最先進的大型語言模型和生成式人工智慧模型的訓練和推論。

探索 NVIDIA 人工智慧推論的優勢

渲染和 3D 繪圖運算

使用 NVIDIA RTX™ 繪圖技術支援高擬真度的創作工作流程。

第三代 RT 核心可提供比前一代高出 2 倍的即時光線追蹤效能，從互動式渲染到即時虛擬製作，都能支援創作令人驚豔的視覺內容和高擬真度的創作工作流程。

深入瞭解 NVIDIA RTX 技術

NVIDIA Omniverse

建立並使用元宇宙應用程式。

NVIDIA Omniverse™ 讓連接、開發和運作新一代工業數位化應用程式成為可能。L40S 具備強大的 RTX 繪圖技術和人工智慧功能，為建立於 Omniverse 的通用場景描述 (OpenUSD) 3D 和模擬工作流程提供卓越效能。ws built on Omniverse.

深入瞭解 NVIDIA Omniverse

NVIDIA OVX L40S

用於高效能人工智慧和圖形的可擴展資料中心基礎架構。

NVIDIA OVX L40S 結合 NVIDIA Spectrum-X 乙太網路技術和 NVIDIA AI Enterprise 軟體，提供業界領先的效能，透過生成式 AI 加速企業轉型。

了解更多

表現

突破性的效能

圖像生成人工智慧

Stable Diffusion (images per minute)

效能量測；NVIDIA L40S
Stable Diffusion v2.1, TRT 8.6.1, BS:1, FP16 | Stable Diffusion XL 1.0, TRT 8.6.1, BS:1, FP16

大型語言模型 (LLM) 推論

1st Token Latency (ms)

效能量測；NVIDIA L40S
Llama 2-7B/13B/70B, ISL=2048, OSL=128, BS=1;: FP8.

規格

NVIDIA L40S GPU

FP32	91.6 兆次浮點運算
TF32 Tensor 核心	366 兆次浮點運算*
FP16	733 兆次浮點運算*
FP8	1,466 兆次浮點運算*
RT 核心效能	212 兆次浮點運算
最大功耗	350W
* 具有稀疏性

查看完整規格查看產品資料表

查看 HPC 應用程式上的最新 GPU 效能

立即開始

準備好購買了嗎？

與 NVIDIA 合作夥伴交談。