NVIDIA L4 Tensor コア GPU

ビデオ、AI、グラフィックスを効率的に実現する、飛躍的進化を遂げたユニバーサル アクセラレータ。

ビデオ、AI、グラフィックスのワークロードを加速

NVIDIA Ada Lovelace アーキテクチャを搭載した NVIDIA L4 Tensor コア GPU は、ビデオ、AI、ビジュアル コンピューティング、グラフィックス、仮想化などのためのユニバーサルでエネルギー効率の高いアクセラレーションを提供します。薄型のフォーム ファクターにパッケージされた L4 は、エッジからデータ センター、クラウドまで、あらゆるサーバーで高いスループットと低遅延を実現する費用対効果、エネルギー効率に優れたソリューションです。

AI ビデオ性能を最大 120 倍向上

AI ビデオ性能を最大 120 倍向上

測定性能: 8 倍速の L4 vs 2 倍速の Intel 8362 CPU サーバー、CV-CUDA® デコード、前処理、推論 (SegFormer)、後処理、エンコード、NVIDIA® TensorRT™ 8.6 と OpenCV 4.7, PyTorch 推論を用いた CPU のみのパイプラインによるエンドツーエンド動画パイプラインの比較。

リアルタイム AI ビデオ パイプラインの性能を体験

NVIDIA L4 のパワーでビデオ アプリケーションを変革しましょう。L4 を搭載したサーバーは、数百万人の視聴者にライブ配信したり、ユーザーがクリエイティブなストーリーを構築したり、没入感のある拡張現実/仮想現実の体験を提供する場合でも、モバイル ユーザー向けに 720p30 で最大 1040 の同時 AV1ビデオ ストリームをホストすることができます¹。

第 4 世代の Tensor コアと 1.5 倍の GPU メモリを備えた NVIDIA L4 GPU と CV-CUDA® ライブラリの組み合わせは、ビデオ コンテンツの理解を新しいレベルに引き上げます。 L4 は、CPU ベースのソリューションよりも 120 倍高い AI ビデオ性能を提供し、企業はリアルタイムで洞察や知見を得ることができ、コンテンツのパーソナライズ、検索の関連性を高め、好ましくないコンテンツの検出、スマート スペース ソリューションの実装することができます。

1. 測定性能: 720p30 で 8 基の L4 AV1 低遅延 P1 プリセット エンコード。

L4 で消費電力と設置スペースを削減

AI や動画が普及するにつれ、効率的でコスト効率の高いコンピューティングへの要求がこれまで以上に高まっています。NVIDIA L4 Tensor コア GPU は、最大 120 倍の AI ビデオ性能を実現し、従来の CPU ベースのインフラと比較して、最大 99% のエネルギー効率の向上と総所有コストの削減を実現します。これにより、企業はラック スペースを削減し、二酸化炭素排出量を大幅に削減でき、データ センターをより多くのユーザーに拡張できるようになります。2 メガワット (MW) のデータ センターで CPU を NVIDIA L4 に切り替えることで節約できるエネルギーは、2,000 軒近い家庭の 1 年間の電力に相当し、10 年間で 172,000 本の木を植えたときのカーボン オフセットに匹敵します。²

 

2. 1.677MW の節約効果を用いた EPA calculator による結果。

エネルギー効率の向上

エネルギー効率の向上

8 基の L4 vs 2S Intel 8362 CPU サーバー TCO 比較: CV-CUDA による前後処理、デコード、推論 (SegFormer)、エンコード、TRT 8.6 と OpenCV 4.7、PyTorch を使用した CPU のみのパイプラインによるエンドツーエンドのビデオ パイプライン推論の比較。

ジェネレーティブ AI の性能を加速

ジェネレーティブ AI 性能が最大 2.5 倍向上

ジェネレーティブ AI 性能が最大 2.5 倍向上

予測性能: L4 と T4 の画像生成比較、512x512 stable diffusion v2.1、FP16、TensorRT 8.5.2.

画像やテキストのジェネレーティブ AI は、あらゆる業界において、顧客の生活をより便利に、体験をより没入感のあるものにします。NVIDIA L4は、前世代の GPU と比較して最大 2.5 倍の性能向上を実現することで、計算負荷の高いジェネレーティブ AI 推論を超高速化します。また、メモリ容量が 50% 増加した L4 は、前世代の GPU では不可能だった最大 1024x768 の大きな画像生成を可能にします。


グラフィックス性能の最適化

4 倍以上のリアルタイム レンダリング性能と 3 倍以上のレイ トレーシング性能の向上

4 倍以上のリアルタイム レンダリング性能と 3 倍以上のレイ トレーシング性能の向上

測定性能:
リアルタイム レンダリング: NVIDIA Omniverse™の性能により、NVIDIA Deep Learning Super (DLSS) 3 による 1080p および 4K でのリアルタイム レンダリングを実現します
レイ トレーシング: レイ トレーシングと DLSS 3 をサポートする AAA タイトルのゲーミング パフォーマンスを向上します。

第 3 世代の RT コアと AI を搭載した NVIDIA Deep Learning Super Sampling 3 (DLSS 3) により、NVIDIA L4 は AI ベースのアバター、NVIDIA Omniverse™ の仮想世界、クラウド ゲーミング、仮想ワークステーション向けに 4 倍以上の高い性能を提供します。これらの機能により、クリエイターは、CPU では不可能な没入感のあるビジュアル体験のために、リアルタイムで映画のような品質のグラフィックスやシーンを構築することができます。

効率的かつ持続的にワークロードを加速

NVIDIA L4 は、NVIDIA データ センター プラットフォームにとって不可欠な存在です。ビデオ、AI、NVIDIA RTX™ 仮想ワークステーション (vWS)、グラフィックス、シミュレーション、データ サイエンス、データ分析のために構築されたこのプラットフォームは、3,000 以上のアプリケーションを加速し、データ センターからエッジ、クラウドまで、あらゆる場所で大規模に利用でき、性能とエネルギー効率を劇的に向上します。

メインストリームでの用途に最適化された L4 は、72W の低消費電力エンベロープで動作する薄型のフォーム ファクターを提供し、NVIDIA のパートナー エコシステムのあらゆるサーバーやクラウド インスタンスのための効率的でコスト効率の良いソリューションです。

企業向け AI ソフトウェアによる開発と導入の効率化

AI の開発と展開を効率化するために最適化された NVIDIA AI Enterprise ソフトウェア スイートには、一般的なデータ センター プラットフォームや NVIDIA L4 GPU を搭載したメインストリームの NVIDIA-Certified Systems™ で動作認定されている AI ソリューション ワークフロー、フレームワーク、学習済みモデル、インフラの最適化が含まれています。

NVIDIA AI Enterprise は、NVIDIA L4 GPU のライセンス追加で、トレーニング、推論、データ サイエンスにおいて最高のパフォーマンスを発揮し、ほぼすべての組織が AI を利用できるようにします。NVIDIA AI Enterprise は、NVIDIA L4 とともに、AI 対応プラットフォームの構築を簡素化し、AI の開発と展開を加速し、性能、セキュリティ、拡張性を提供することで、より早く洞察や知見を集め、ビジネス価値をより速く達成します。

L4 を導入しているお客様

製品仕様

フォーム ファクター L4
FP32 30.3 teraFLOPs
TF32 Tensor コア 120 teraFLOPS*
FP16 Tensor コア 242 teraFLOPS*
BFLOAT16 Tensor コア 242 teraFLOPS*
FP8 Tensor コア 485 teraFLOPs*
INT8 Tensor コア 485 TOPs*
GPU メモリ 24GB
GPU メモリ帯域幅 300GB/s
NVENC | NVDEC | JPEG デコーダー 2 | 4 | 4
最大熱設計電力 (TDP) 72W
フォーム ファクター 1- スロット ロープロファイル、 PCIe
インターコネクト PCIe Gen4 x16 64GB/s
サーバー オプション 1-8 基の GPUが搭載できるパートナーおよび NVIDIA-Certified Systems 対応システム

* スパース性ありで示しています。スパース性なし場合は 2 分の 1 のスペックになります。

Google Cloud の L4 早期アクセス