NVIDIA L4 Tensor 核心 GPU

專用於高效視訊、人工智慧和圖像的突破性通用加速器

加速視訊、人工智慧及圖像工作負載

搭載 NVIDIA Ada Lovelace 架構 的 NVIDIA L4 Tensor Core GPU,可提供視訊、人工智慧、視覺運算、圖像、虛擬化等多方面通用且節能的加速能力。L4 架構採用低調外形封裝,是一款成本效益高且節能的解決方案,能在從邊緣到數據中心再到雲端的每個伺服器中,實現高吞吐量和低延遲的優異表現。

高達 120 倍的 AI 視訊效能

L4 提供高達 120 倍的 AI 視頻性能

實測效能:使用CV-CUDA®解碼、前處理、推論(SegFormer)、後處理、編碼的端到端視訊流程,以 8 倍 L4 對 2S Intel 8362 CPU 伺服器進行比較,並使用 NVIDIA® TensorRT™ 8.6 與僅使用 OpenCV 4.7、PyTorch 推論的 CPU 流程進行比較。

體驗即時 AI 視訊管道效能

透過 NVIDIA L4 的強大能力轉換視訊應用程式。不論是即時串流給數百萬觀眾、讓使用者建構創意故事,或是提供身臨其境的增強實境和虛擬實境體驗 (AR/VR),配備 L4 的伺服器能夠容納高達 1,040 個同時進行的 AV1 視訊串流,並支援 720p30 的行動裝置用戶¹。

憑藉第四代 Tensor Core 和 1.5 倍大的 GPU 內存,NVIDIA L4 GPU 配合 CV-CUDA® 處理庫將視訊內容理解提升到新的水平。 L4 比基於 CPU 的解決方案提供了超過 120 倍的 AI 視訊效能,讓企業獲得實時的洞察力,以個性化內容,提高搜索相關性,檢測不良內容,實現智慧空間解決方案。

1. 實測效能:8x L4 AV1 低延遲 P1 預設編碼為 720p30。

使用 L4 技術 節省能源及空間

隨著人工智慧和視訊技術日益普及,對於高效率、成本效益的運算需求比以往更顯重要。NVIDIA L4 Tensor Core GPU 提供高達 120 倍的 AI 視訊運算效能,相較於傳統基於 CPU 的架構,可達到高達 99% 的能源效率和更低的擁有成本。這讓企業可以減少機架空間,大幅降低碳足跡,同時可以擴展其數據中心的用戶數量。從 CPU 轉換到 NVIDIA L4s 將在 2 兆瓦(MW)的資料中心所節省的能源,可為近 2,000 個家庭提供一年的電力,或相當於種植了 172,000 棵樹抵銷 10 年碳排放量。²

 

2 使用 EPA 所獲得 1.677 兆瓦的節能結果。

更好的能源效率

L4 提供高達 99% 的更好能源效率

8x L4 與 2S Intel 8362 CPU 服務器 TCO 比較:使用 CV-CUDA 預處理和後處理、解碼、推理 (SegFormer)、編碼、TRT 8.6 與使用 OpenCV 4.7、PyTorch 的僅 CPU 管道的端到端視頻管道推理。

加速生成式 AI 效能

高達 2.5 倍的生成式 AI 效能

L4 提供高達 2.5 倍的生成 AI 性能

預期效能:使用 L4 與 T4 圖像生成,512x512 穩定擴散 v2.1,FP16,TensorRT 8.5.2。

圖像和文本的生成式 AI 可讓各行各業及你我生活更為便利,體驗更加身臨其境的感受。NVIDIA L4 透過提供比前一代 GPU 高達 2.5 倍的效能,加速運算密集型生成式 AI 推理。並且憑藉著超過 50% 的內存量,L4 支援更大型的圖像生成,最高可達 1024x768,這是過去的 GPU 世代所無法實現的。


優化圖像效能

即時渲染性能高達 4倍以上 光線追蹤性能提高 3倍以上

L4 為基於 AI 的化身提供超過 4 倍的渲染性能

實測性能:
即時渲染:NVIDIA Omniverse™ 效能,可通過 NVIDIA Deep Learning Super 以 1080p 和 4K 進行即時渲染 採樣 (DLSS) 3.
光線追蹤(Ray tracing):用於 AAA 級遊戲中,支援光線追蹤(ray tracing)和 DLSS 3.0 技術的遊戲效能幾何平均值。

憑藉第三代 RT 核心和由人工智慧驅動的 NVIDIA Deep Learning Super Sampling 3(DLSS 3),NVIDIA L4 為人工智慧頭像、NVIDIA Omniverse™虛擬世界、雲端遊戲和虛擬工作站等方面,提升超過 4 倍的效能表現。這些功能使創作者能夠建立即時且電影般的圖像和場景創作,提供優異視覺體驗,而這些體驗是單使用 CPU 所無法實現的。

有效率與永續地加速工作負載

NVIDIA L4 是 NVIDIA 資料中心平台的重要組成部分。該平台針對視訊、人工智慧、NVIDIA RTX™虛擬工作站 (vWS)、圖像、模擬、資料科學和數據分析等方面進行了優化,可加速超過 3,000 個應用程式,並可大規模地在各個場景中使用,包括數據中心、邊緣運算和雲端,不僅可以實現顯著的性能提升,還可提供節能表現。

針對主流部署進行優化,L4採用低調設計,提供在72W低功耗範圍內運算,使其成為NVIDIA 合作夥伴生態系統中任何伺服器或雲端實例的高效具成本效益的解決方案。

使用企業級人工智能軟體優化開發和部署流程

NVIDIA AI Enterprise 軟體套件是為了精簡人工智慧的開發與部署而設計,包含 AI 解決方案工作流程、框架、預先訓練模型,以及基礎架構最佳化等功能,並已經通過認證,可以在常見的資料中心平台和搭載 NVIDIA L4 GPU 的主流 NVIDIA 認證系統上運行。

NVIDIA AI Enterprise 是針對 NVIDIA L4 GPU 的授權附加項目,可使 AI 在訓練、推論和數據科學方面的性能提升至最高,讓幾乎每個組織都能夠使用 AI。NVIDIA AI Enterprise 與 NVIDIA L4 共同簡化 AI 平台的建造,加速 AI 開發和部署,並提供了更快地收集洞察力、更快地實現商業價值的性能、安全性和可擴展性。

L4 使用者

產品規格

規格 L4
FP32 30.3 兆次浮點運算
TF32 Tensor 核心 120 兆次浮點運算*
FP16 Tensor 核心 242 兆次浮點運算*
BFLOAT16 Tensor 核心 242 兆次浮點運算*
FP8 Tensor 核心 485 兆次浮點運算*
INT8 Tensor 核心 485 TOPs*
顯示卡記憶體 24GB
顯示卡記憶體頻寬 300GB/秒
NVENC | NVDEC | JPEG 解碼器 2 | 4 | 4
最大熱設計功率 (TDP) 72W
規格 1 個薄型插槽,PCIe
互聯 PCIe Gen4 x16 64GB/秒
伺服器選項 具有 1-8 個 GPU 的合作夥伴和 NVIDIA 認證系統

* 顯示稀疏性。在沒有稀疏性的情況下,規格會降低一半。

在 Google Cloud 上使用 L4 搶先體驗版