データ センターの AI とグラフィックスで発揮される比類なきパフォーマンス。
NVIDIA パートナーからご購入いただけます。
データシート | 製品概要 | 仕様 ディープラーニング パフォーマンス ページ
NVIDIA L40S GPU で画期的なマルチワークロード パフォーマンスをご体験ください。パワフルな AI コンピューティングとこのクラスで最高のグラフィックスとメディア高速化を組み合わせた L40S GPU は、生成 AI や LLM (大規模言語モデル) の推論とトレーニングから 3D グラフィックス、レンダリング、ビデオまで、次世代のデータ センター ワークロードにパワーを与えます。
Dell Technologies、Hewlett Packard Enterprise、Lenovo、Supermicro などから近日提供予定の OVX サーバーには新しい NVIDIA GPU が搭載され、トレーニングと推論、グラフィックスを多用するワークロードを加速します。
1,466 TFLOPS¹
212 TFLOPS
91.6 TFLOPS
1 ピーク レートは GPU ブーストクロックに基づきます。
構造的なスパース性と最適化された TF32 形式のハードウェア サポートによる パフォーマンス向上で、AI とデータ サイエンス のモデル トレーニングが高速化します。AI で強化するグラフィックス機能を DLSS で加速させ、一部のアプリケーションで解像度を格段にアップさせます。
スループットとコンカレント レイトレーシングとシェーディング機能が強化され、レイトレーシングのパフォーマンスが向上し、製品設計や建築、エンジニアリング、建設のワークフローのレンダリングが高速化されます。実際に動作している実物のようなデザインをご覧ください。ハードウェアによりモーション ブラーを高速化し、驚異的なリアルタイム アニメーションを実現しています。
単精度浮動小数点 (FP32) スループットの高速化と電力効率の向上により、3D モデル開発や CAE (Computer-Aided Engineering) シミュレーションなどのワークフローでパフォーマンスが大幅に向上します。混合精度ワークロード向けの拡張 16 ビット演算機能 (BF16) を使用。
Transformer Engine は AI パフォーマンスを劇的に加速し、トレーニングと推論の両方でメモリ使用率を改善します。Ada Lovelace の第 4 世代 Tensor コアのパワーを利用する Transformer Engine は、Transformer アーキテクチャ ニューラル ネットワークの層をインテリジェントにスキャンし、FP8 と FP16 の精度を自動的に再構築してより高速な AI パフォーマンスを実現し、トレーニングと推論を加速します。
L40S GPU は、24 時間 365 日稼動するエンタープライズ データ センター運用に最適化されており、最大限のパフォーマンス、耐久性、アップタイムを確保するために、NVIDIA によって設計、構築、テスト、サポートされています。L40S GPU は最新のデータ センター標準を満たし、NEBS (Network Equipment-Building System) レベル 3 に対応し、Root of Trust 技術によるセキュア ブートを備え、データ センターにさらなるセキュリティ層を提供します。
L40S GPU は、NVIDIA DLSS 3 により超高速のレンダリングと滑らかなフレーム レートを可能にします。この画期的なフレーム生成技術は、Ada Lovelace アーキテクチャと L40S GPU のディープラーニングと最新のハードウェア イノベーション (第 4 世代 Tensor コアやオプティカル フロー アクセラレータなど) を活用し、レンダリング性能を高め、FPS (フレーム毎秒) を上げ、レイテンシを大幅に改善します。
新しいサービス、インサイト、オリジナル コンテンツを開発します。
次世代 AI、グラフィックス、メディア アクセラレーション機能を備えた L40S は、前世代の NVIDIA A40 よりも最大 5 倍高い推論性能を提供します。画期的なパフォーマンスと 48 ギガバイト (GB) のメモリ容量を備えた L40S は、マルチモーダル生成 AI ワークロードを加速するのに理想的なプラットフォームです。
AI のトレーニングと推論のワークロードを高速化します。
FP8 をサポートする第 4 世代 Tensor コアは、卓越した AI コンピューティング パフォーマンスを提供し、最先端の LLM と生成 AI モデルのトレーニングと推論を高速化します。
NVIDIA RTX™ グラフィックスで忠実度の高いクリエイティブ ワークフローにパワーを与えます。
第 3 世代 RT コアは、前世代の最大 2 倍のリアルタイム レイトレーシング パフォーマンスを提供し、インタラクティブ レンダリングからリアルタイムの仮想制作まで、驚異的なビジュアル コンテンツと忠実度の高いクリエイティブ ワークフローの制作にパワーを与えます。
メタバース アプリケーションの作成と運用をします。
NVIDIA Omniverse™ は、次世代の産業デジタル化アプリケーションの接続、開発、運用を可能にします。パワフルな RTX グラフィックスと AI 機能を備えた L40S は、Omniverse で構築された Universal Scene Description (OpenUSD) ベースの 3D ワークフローとシミュレーション ワークフローに優れたパフォーマンスを提供します。
高性能な AI とグラフィックスのためのスケーラブルなデータ センター インフラストラクチャ。
NVIDIA Spectrum-X Ethernet テクノロジと NVIDIA AI Enterprise ソフトウェアを組み合わせることで、NVIDIA OVX L40S は業界をリードするパフォーマンスを提供し、生成 AI による企業の変革を加速します。
Stable Diffusion (images per minute)
性能測定; NVIDIA L40S Stable Diffusion v2.1, TRT 8.6.1, BS:1, FP16 | Stable Diffusion XL 1.0, TRT 8.6.1, BS:1, FP16
1st Token Latency (ms)
性能測定; NVIDIA L40S Llama 2-7B/13B/70B, ISL=2048, OSL=128, BS=1;: FP8.
* スパース性対応
NVIDIAパートナーにご相談ください。
専門的なニーズについて、NVIDIA の製品スペシャリストにご相談ください。
NVIDIA から最新ニュース、お知らせなどの情報をお送りします。
NVIDIA プライバシー ポリシー
* 疎性あり