NVIDIA L4 Tensor コア GPU

ビデオ、AI、グラフィックスを効率的に実現する、飛躍的進化を遂げたユニバーサルアクセラレータ。

性能

ビデオ、AI、グラフィックスのワークロードを加速

NVIDIA Ada Lovelace アーキテクチャを搭載した NVIDIA L4 Tensor コア GPU は、ビデオ、AI、ビジュアルコンピューティング、グラフィックス、仮想化などのためのユニバーサルでエネルギー効率の高いアクセラレーションを提供します。薄型のフォームファクターにパッケージされた L4 は、エッジからデータセンター、クラウドまで、あらゆるサーバーで高いスループットと低遅延を実現する費用対効果、エネルギー効率に優れたソリューションです。

NVIDIA L4 データシートを見る

NVIDIA L4 製品概要を見る

AI ビデオ性能を最大 120 倍向上

測定性能: 8 倍速の L4 vs 2 倍速の Intel 8362 CPU サーバー、CV-CUDA® デコード、前処理、推論 (SegFormer)、後処理、エンコード、NVIDIA® TensorRT™ 8.6 と OpenCV 4.7, PyTorch 推論を用いた CPU のみのパイプラインによるエンドツーエンド動画パイプラインの比較。

リアルタイム AI ビデオパイプラインの性能を体験

NVIDIA L4 のパワーでビデオアプリケーションを変革しましょう。L4 を搭載したサーバーは、数百万人の視聴者にライブ配信したり、ユーザーがクリエイティブなストーリーを構築したり、没入感のある拡張現実/仮想現実の体験を提供する場合でも、モバイルユーザー向けに 720p30 で最大 1040 の同時 AV1ビデオストリームをホストすることができます¹。

第 4 世代の Tensor コアと 1.5 倍の GPU メモリを備えた NVIDIA L4 GPU と CV-CUDA® ライブラリの組み合わせは、ビデオコンテンツの理解を新しいレベルに引き上げます。 L4 は、CPU ベースのソリューションよりも 120 倍高い AI ビデオ性能を提供し、企業はリアルタイムで洞察や知見を得ることができ、コンテンツのパーソナライズ、検索の関連性を高め、好ましくないコンテンツの検出、スマートスペースソリューションの実装することができます。

1. 測定性能: 720p30 で 8 基の L4 AV1 低遅延 P1 プリセットエンコード。

L4 で実行可能な AI ビデオワークロードの詳細を見る

L4 で消費電力と設置スペースを削減

AI や動画が普及するにつれ、効率的でコスト効率の高いコンピューティングへの要求がこれまで以上に高まっています。NVIDIA L4 Tensor コア GPU は、最大 120 倍の AI ビデオ性能を実現し、従来の CPU ベースのインフラと比較して、最大 99％のエネルギー効率の向上と総所有コストの削減を実現します。これにより、企業はラックスペースを削減し、二酸化炭素排出量を大幅に削減でき、データセンターをより多くのユーザーに拡張できるようになります。2 メガワット (MW) のデータセンターで CPU を NVIDIA L4 に切り替えることで節約できるエネルギーは、2,000 軒近い家庭の 1 年間の電力に相当し、10 年間で 172,000 本の木を植えたときのカーボンオフセットに匹敵します。²

HPC アプリケーションにおける最新の GPU 性能を見る

2. 1.677MW の節約効果を用いた EPA calculator による結果。

エネルギー効率の向上

8 基の L4 vs 2S Intel 8362 CPU サーバー TCO 比較: CV-CUDA による前後処理、デコード、推論 (SegFormer)、エンコード、TRT 8.6 と OpenCV 4.7、PyTorch を使用した CPU のみのパイプラインによるエンドツーエンドのビデオパイプライン推論の比較。

ジェネレーティブ AI の性能を加速

ジェネレーティブ AI 性能が最大 2.5 倍向上

予測性能: L4 と T4 の画像生成比較、512x512 stable diffusion v2.1、FP16、TensorRT 8.5.2.

画像やテキストのジェネレーティブ AI は、あらゆる業界において、顧客の生活をより便利に、体験をより没入感のあるものにします。NVIDIA L4は、前世代の GPU と比較して最大 2.5 倍の性能向上を実現することで、計算負荷の高いジェネレーティブ AI 推論を超高速化します。また、メモリ容量が 50% 増加した L4 は、前世代の GPU では不可能だった最大 1024x768 の大きな画像生成を可能にします。

グラフィックス性能の最適化

4 倍以上のリアルタイムレンダリング性能と 3 倍以上のレイトレーシング性能の向上

測定性能:
リアルタイムレンダリング: NVIDIA Omniverse™の性能により、NVIDIA Deep Learning Super (DLSS) 3 による 1080p および 4K でのリアルタイムレンダリングを実現します
レイトレーシング: レイトレーシングと DLSS 3 をサポートする AAA タイトルのゲーミングパフォーマンスを向上します。

第 3 世代の RT コアと AI を搭載した NVIDIA Deep Learning Super Sampling 3 (DLSS 3) により、NVIDIA L4 は AI ベースのアバター、NVIDIA Omniverse™ の仮想世界、クラウドゲーミング、仮想ワークステーション向けに 4 倍以上の高い性能を提供します。これらの機能により、クリエイターは、CPU では不可能な没入感のあるビジュアル体験のために、リアルタイムで映画のような品質のグラフィックスやシーンを構築することができます。

効率的かつ持続的にワークロードを加速

NVIDIA L4 は、NVIDIA データセンタープラットフォームにとって不可欠な存在です。ビデオ、AI、NVIDIA RTX™ 仮想ワークステーション (vWS)、グラフィックス、シミュレーション、データサイエンス、データ分析のために構築されたこのプラットフォームは、3,000 以上のアプリケーションを加速し、データセンターからエッジ、クラウドまで、あらゆる場所で大規模に利用でき、性能とエネルギー効率を劇的に向上します。

メインストリームでの用途に最適化された L4 は、72W の低消費電力エンベロープで動作する薄型のフォームファクターを提供し、NVIDIA のパートナーエコシステムのあらゆるサーバーやクラウドインスタンスのための効率的でコスト効率の良いソリューションです。

NVIDIA vWS 購入方法

企業向け AI ソフトウェアによる開発と導入の効率化

AI の開発と展開を効率化するために最適化された NVIDIA AI Enterprise ソフトウェアスイートには、一般的なデータセンタープラットフォームや NVIDIA L4 GPU を搭載したメインストリームの NVIDIA-Certified Systems™ で動作認定されている AI ソリューションワークフロー、フレームワーク、学習済みモデル、インフラの最適化が含まれています。

NVIDIA AI Enterprise は、NVIDIA L4 GPU のライセンス追加で、トレーニング、推論、データサイエンスにおいて最高のパフォーマンスを発揮し、ほぼすべての組織が AI を利用できるようにします。NVIDIA AI Enterprise は、NVIDIA L4 とともに、AI 対応プラットフォームの構築を簡素化し、AI の開発と展開を加速し、性能、セキュリティ、拡張性を提供することで、より早く洞察や知見を集め、ビジネス価値をより速く達成します。

NVIDIA LaunchPad で NVIDIA AI Enterprise を始める

NVIDIA LaunchPad の詳細を見る

L4 を導入しているお客様

製品仕様

フォームファクター	L4
FP32	30.3 teraFLOPs
TF32 Tensor コア	120 teraFLOPS*
FP16 Tensor コア	242 teraFLOPS*
BFLOAT16 Tensor コア	242 teraFLOPS*
FP8 Tensor コア	485 teraFLOPs*
INT8 Tensor コア	485 TOPs*
GPU メモリ	24GB
GPU メモリ帯域幅	300GB/s
NVENC \| NVDEC \| JPEG デコーダー	2 \| 4 \| 4
最大熱設計電力 (TDP)	72W
フォームファクター	1- スロットロープロファイル、 PCIe
インターコネクト	PCIe Gen4 x16 64GB/s
サーバーオプション	1-8 基の GPUが搭載できるパートナーおよび NVIDIA-Certified Systems 対応システム

* スパース性ありで示しています。スパース性なし場合は 2 分の 1 のスペックになります。

Google Cloud の L4 早期アクセス

早期アクセスに申し込む