데이터센터를 위한 독보적인 AI 및 그래픽 성능.
NVIDIA 파트너 찾기.
데이터시트 | 제품 개요 | 사양 딥 러닝 성능 페이지
NVIDIA L40S GPU로 획기적인 멀티 워크로드 성능을 경험하세요. 강력한 AI 컴퓨팅과 동급 최고의 그래픽스 및 미디어 가속화를 결합한 L40S GPU는 생성형 AI와 대형 언어 모델(LLM) 추론 및 훈련에서부터 3D 그래픽, 렌더링, 영상에 이르는 차세대 데이터센터 워크로드를 지원하도록 제작되었습니다.
그래픽 집약적인 워크로드뿐만 아니라 트레이닝 및 추론을 가속화하는 새로운 NVIDIA GPU를 탑재한 NVIDIA OVX™ 서버가 Dell, Hewlett Packard Enterprise, Lenovo, Supermicro 등에서 곧 출시될 예정입니다.
1,466 TFLOPS¹
212 TFLOPS
91.6 TFLOPS
1 최고 속도는 GPU 부스트 클럭 기준입니다.
구조적 희소성 및 최적화된 TF32 형식에 대한 하드웨어 지원은 더 빠른 AI 및 데이터 사이언스 모델 트레이닝을 위한 기본 성능 향상을 제공합니다. DLSS로 AI 향상 그래픽 기능을 가속화하여 일부 애플리케이션에서 더 나은 성능으로 해상도를 업스케일링할 수 있습니다.
향상된 처리량과 동시 레이 트레이싱 및 음영 처리 기능이 레이 트레이싱 성능을 향상하여 제품 디자인 및 아키텍처, 엔지니어링, 건설 워크플로우를 위한 렌더링을 가속화합니다. 하드웨어 가속 모션 블러와 놀라운 실시간 애니메이션은 실제 같은 디자인을 구현합니다.
가속화된 단정밀도 부동 소수점(FP32) 처리량 및 향상된 전력 효율성은 3D 모델 개발 및 CAE(컴퓨터 보조 엔지니어링) 시뮬레이션과 같은 워크플로우의 성능을 크게 향상합니다. 혼합 정밀도 워크로드에는 향상된 16비트 연산 기능(BF16)을 사용합니다.
트랜스포머 엔진은 AI 성능을 획기적으로 가속화하고 훈련과 추론 모두에서 메모리 활용도를 개선합니다. Ada Lovelace 4세대 Tensor 코어의 강력한 성능을 활용하는 트랜스포머 엔진은 트랜스포머 아키텍처 신경망의 레이어를 지능적으로 스캔하고 FP8과 FP16 정밀도 사이에서 자동으로 리캐스트하여 더 빠른 AI 성능을 제공하고 학습 및 추론 속도를 높입니다.
L40S GPU는 엔터프라이즈 데이터센터의 24시간 운영에 최적화되었으며 최대의 성능, 내구성, 가동 시간을 보장하기 위해 NVIDIA에서 설계, 테스트, 구축, 지원합니다. L40S GPU는 최신 데이터센터 표준을 충족하고 네트워크 장비 구축 시스템(NEBS) 레벨 3을 지원하며, RoT(Root of Trust) 기술을 통한 안전한 부팅으로 데이터센터에 추가적인 보안 계층을 제공합니다.
L40S GPU는 NVIDIA DLSS 3를 통해 초고속 렌더링과 더 부드러운 프레임 레이트를 지원합니다. 이 획기적인 프레임 생성 기술은 딥 러닝과 4세대 Tensor 코어 및 광학 흐름 가속기를 포함하는 L40S GPU 및 Ada Lovelace 아키텍처의 최신 하드웨어 혁신을 활용하여 렌더링 성능을 높이고 더 높은 초당 프레임(FPS)을 제공하며 지연 시간을 크게 개선합니다.
새로운 서비스, 인사이트, 독창적인 콘텐츠를 개발하세요.
차세대 AI, 그래픽 및 미디어 가속화 기능을 갖춘 L40S는 이전 세대 NVIDIA A40보다 최대 5배 더 높은 추론 성능을 제공합니다. 획기적인 성능과 48기가바이트(GB)의 메모리 용량을 갖춘 L40S는 멀티모달 생성형 AI 워크로드를 가속화하는 데 이상적인 플랫폼입니다.
AI 훈련 및 추론 워크로드를 가속화하세요.
FP8을 지원하는 4세대 Tensor 코어는 탁월한 AI 컴퓨팅 성능을 제공하여 최첨단 LLM 및 생성형 AI 모델의 훈련과 추론을 가속화합니다.
NVIDIA RTX™ 그래픽으로 높은 충실도의 크리에이티브 워크플로우를 지원하세요.
이전 세대 대비 최대 2배의 실시간 레이 트레이싱 성능을 제공하는 3세대 RT 코어를 통해 인터랙티브 렌더링에서 실시간 버츄얼 제작에 이르기까지 놀라운 비주얼 콘텐츠와 충실도 높은 크리에이티브 워크플로우를 제작할 수 있습니다.
메타버스 애플리케이션을 구축 및 운영하세요.
NVIDIA Omniverse™를 사용하면 차세대 산업 디지털화 애플리케이션을 연결, 개발, 운영할 수 있습니다. 강력한 RTX 그래픽 및 AI 기능을 갖춘 L40S는 Omniverse에 구축된 OpenUSD(Universal Scene Description) 기반 3D 및 시뮬레이션 워크플로우에 탁월한 성능을 제공합니다.
고성능 AI 및 그래픽을 위한 확장 가능한 데이터센터 인프라.
NVIDIA Spectrum-X 이더넷 기술 및 NVIDIA AI 엔터프라이즈 소프트웨어와 결합된 NVIDIA OVX L40S는 업계 최고의 성능을 제공하여 생성형 AI로 엔터프라이즈 혁신을 가속화합니다.
Stable Diffusion (images per minute)
측정된 성능; NVIDIA L40S Stable Diffusion v2.1, TRT 8.6.1, BS:1, FP16 | Stable Diffusion XL 1.0, TRT 8.6.1, BS:1, FP16
1st Token Latency (ms)
측정된 성능; NVIDIA L40S Llama 2-7B/13B/70B, ISL=2048, OSL=128, BS=1;: FP8.
* 희소성 포함
NVIDIA 파트너와 상담하세요.
NVIDIA 제품 전문가에게 전문적인 요구 사항에 대해 문의하세요.
NVIDIA의 뉴스를 구독하세요.
NVIDIA 개인정보보호정책
*희소성 포함