NVIDIA L40S

데이터센터를 위한 독보적인 AI 및 그래픽 성능.

구매처

NVIDIA 파트너 찾기.

파트너 찾기

데이터시트 | 제품 개요 | 사양
딥 러닝 성능 페이지

소개

파트너 찾기

가장 강력한 범용 GPU

NVIDIA L40S GPU로 획기적인 멀티 워크로드 성능을 경험하세요. 강력한 AI 컴퓨팅과 동급 최고의 그래픽스 및 미디어 가속화를 결합한 L40S GPU는 생성형 AI와 대형 언어 모델(LLM) 추론 및 훈련에서부터 3D 그래픽, 렌더링, 영상에 이르는 차세대 데이터센터 워크로드를 지원하도록 제작되었습니다.

NVIDIA, 글로벌 데이터센터 시스템 제조업체와 함께 생성형 AI 및 산업 디지털화 가속화

그래픽 집약적인 워크로드뿐만 아니라 트레이닝 및 추론을 가속화하는 새로운 NVIDIA GPU를 탑재한 NVIDIA OVX™ 서버가 Dell, Hewlett Packard Enterprise, Lenovo, Supermicro 등에서 곧 출시될 예정입니다.

보도 자료 읽기

하이라이트

범용 성능

Tensor 성능

1,466 TFLOPS¹

RT 코어 성능

212 TFLOPS

단정밀도 성능

91.6 TFLOPS

¹ 최고 속도는 GPU 부스트 클럭 기준입니다.

특징

NVIDIA Ada Lovelace 아키텍처 기반

4세대 Tensor 코어

구조적 희소성 및 최적화된 TF32 형식에 대한 하드웨어 지원은 더 빠른 AI 및 데이터 사이언스 모델 트레이닝을 위한 기본 성능 향상을 제공합니다. DLSS로 AI 향상 그래픽 기능을 가속화하여 일부 애플리케이션에서 더 나은 성능으로 해상도를 업스케일링할 수 있습니다.

3세대 RT 코어

향상된 처리량과 동시 레이 트레이싱 및 음영 처리 기능이 레이 트레이싱 성능을 향상하여 제품 디자인 및 아키텍처, 엔지니어링, 건설 워크플로우를 위한 렌더링을 가속화합니다. 하드웨어 가속 모션 블러와 놀라운 실시간 애니메이션은 실제 같은 디자인을 구현합니다.

CUDA 코어

가속화된 단정밀도 부동 소수점(FP32) 처리량 및 향상된 전력 효율성은 3D 모델 개발 및 CAE(컴퓨터 보조 엔지니어링) 시뮬레이션과 같은 워크플로우의 성능을 크게 향상합니다. 혼합 정밀도 워크로드에는 향상된 16비트 연산 기능(BF16)을 사용합니다.

트랜스포머 엔진

트랜스포머 엔진은 AI 성능을 획기적으로 가속화하고 훈련과 추론 모두에서 메모리 활용도를 개선합니다. Ada Lovelace 4세대 Tensor 코어의 강력한 성능을 활용하는 트랜스포머 엔진은 트랜스포머 아키텍처 신경망의 레이어를 지능적으로 스캔하고 FP8과 FP16 정밀도 사이에서 자동으로 리캐스트하여 더 빠른 AI 성능을 제공하고 학습 및 추론 속도를 높입니다.

효율성 및 보안

L40S GPU는 엔터프라이즈 데이터센터의 24시간 운영에 최적화되었으며 최대의 성능, 내구성, 가동 시간을 보장하기 위해 NVIDIA에서 설계, 테스트, 구축, 지원합니다. L40S GPU는 최신 데이터센터 표준을 충족하고 네트워크 장비 구축 시스템(NEBS) 레벨 3을 지원하며, RoT(Root of Trust) 기술을 통한 안전한 부팅으로 데이터센터에 추가적인 보안 계층을 제공합니다.

DLSS 3

L40S GPU는 NVIDIA DLSS 3를 통해 초고속 렌더링과 더 부드러운 프레임 레이트를 지원합니다. 이 획기적인 프레임 생성 기술은 딥 러닝과 4세대 Tensor 코어 및 광학 흐름 가속기를 포함하는 L40S GPU 및 Ada Lovelace 아키텍처의 최신 하드웨어 혁신을 활용하여 렌더링 성능을 높이고 더 높은 초당 프레임(FPS)을 제공하며 지연 시간을 크게 개선합니다.

NVIDIA Ada Lovelace 아키텍처에 대해 자세히 알아보기

워크로드

멀티 워크로드 가속화

생성형 AI

새로운 서비스, 인사이트, 독창적인 콘텐츠를 개발하세요.

차세대 AI, 그래픽 및 미디어 가속화 기능을 갖춘 L40S는 이전 세대 NVIDIA A40보다 최대 5배 더 높은 추론 성능을 제공합니다. 획기적인 성능과 48기가바이트(GB)의 메모리 용량을 갖춘 L40S는 멀티모달 생성형 AI 워크로드를 가속화하는 데 이상적인 플랫폼입니다.

생성형 AI에 대해 자세히 알아보기

LLM 훈련 및 추론

AI 훈련 및 추론 워크로드를 가속화하세요.

FP8을 지원하는 4세대 Tensor 코어는 탁월한 AI 컴퓨팅 성능을 제공하여 최첨단 LLM 및 생성형 AI 모델의 훈련과 추론을 가속화합니다.

NVIDIA AI 추론의 이점 살펴보기

렌더링 및 3D 그래픽

NVIDIA RTX™ 그래픽으로 높은 충실도의 크리에이티브 워크플로우를 지원하세요.

이전 세대 대비 최대 2배의 실시간 레이 트레이싱 성능을 제공하는 3세대 RT 코어를 통해 인터랙티브 렌더링에서 실시간 버츄얼 제작에 이르기까지 놀라운 비주얼 콘텐츠와 충실도 높은 크리에이티브 워크플로우를 제작할 수 있습니다.

NVIDIA RTX 기술에 대해 자세히 알아보기

NVIDIA Omniverse

메타버스 애플리케이션을 구축 및 운영하세요.

NVIDIA Omniverse™를 사용하면 차세대 산업 디지털화 애플리케이션을 연결, 개발, 운영할 수 있습니다. 강력한 RTX 그래픽 및 AI 기능을 갖춘 L40S는 Omniverse에 구축된 OpenUSD(Universal Scene Description) 기반 3D 및 시뮬레이션 워크플로우에 탁월한 성능을 제공합니다.

NVIDIA Omniverse에 대해 자세히 알아보기

NVIDIA OVX L40S

고성능 AI 및 그래픽을 위한 확장 가능한 데이터센터 인프라.

NVIDIA Spectrum-X 이더넷 기술 및 NVIDIA AI 엔터프라이즈 소프트웨어와 결합된 NVIDIA OVX L40S는 업계 최고의 성능을 제공하여 생성형 AI로 엔터프라이즈 혁신을 가속화합니다.

자세히 알아보기

성능

획기적인 성능

이미지 생성형 AI

Stable Diffusion (images per minute)

측정된 성능; NVIDIA L40S
Stable Diffusion v2.1, TRT 8.6.1, BS:1, FP16 | Stable Diffusion XL 1.0, TRT 8.6.1, BS:1, FP16

대규모 언어 모델(LLM) 추론

1st Token Latency (ms)

측정된 성능; NVIDIA L40S
Llama 2-7B/13B/70B, ISL=2048, OSL=128, BS=1;: FP8.

사양

NVIDIA L40S GPU

FP32	91.6테라플롭스
TF32 Tensor 코어	366테라플롭스*
FP16	733테라플롭스*
FP8	1,466테라플롭스*
RT 코어 성능	212테라플롭스
최대 소비 전력	350W
* 희소성 포함

전체 사양 보기 데이터시트 보기

HPC 애플리케이션의 최신 GPU 성능 검토

시작하기

구매할 준비가 되셨나요?

NVIDIA 파트너와 상담하세요.

파트너 찾기

적합한 제품 또는 파트너를 선택하는 데 도움이 필요하신가요?

NVIDIA 제품 전문가에게 전문적인 요구 사항에 대해 문의하세요.

문의하기

GPU 아키텍처	NVIDIA Ada Lovelace 아키텍처
GPU 메모리	48GB GDDR6(ECC 포함)
메모리 대역폭	864GB/s
인터커넥트 인터페이스	PCIe Gen4 x16: 양방향 64GB/s
NVIDIA Ada Lovelace 아키텍처 기반의 CUDA® 코어	18,176
NVIDIA 3세대 RT 코어	142
NVIDIA 4세대 Tensor 코어	568
RT 코어 성능 TFLOPS	212
FP32 TFLOPS	91.6
TF32 Tensor 코어 TFLOPS	183 I 366*
BFLOAT16 Tensor 코어 TFLOPS	362.05 I 733*
FP16 Tensor 코어	362.05 I 733*
FP8 Tensor 코어	733 I 1,466*
최대 INT8 Tensor TOPS 최대 INT4 Tensor TOPS	733 I 1,466* 733 I 1,466*
폼 팩터	4.4"(H) x 10.5"(L), 듀얼 슬롯
디스플레이 포트	DisplayPort 1.4a 4개
최대 소비 전력	350W
전원 커넥터	16핀
열처리	수동
버츄얼 GPU(vGPU) 소프트웨어 지원	예
vGPU 프로파일 지원	버츄얼 GPU 라이선싱 가이드 보기
NVENC I NVDEC	3x \| 3x (AV1 인코딩 및 디코딩 포함)
RoT(Root of Trust)를 통한 안전한 부팅	예
NEBS 지원	레벨 3
MIG(Multi-Instance GPU) 지원	아니요
NVIDIA® NVLink® 지원	아니요
*희소성 포함

NVIDIA L40S

구매처

가장 강력한 범용 GPU

NVIDIA, 글로벌 데이터센터 시스템 제조업체와 함께 생성형 AI 및 산업 디지털화 가속화

하이라이트

범용 성능

Tensor 성능

RT 코어 성능

단정밀도 성능

특징

NVIDIA Ada Lovelace 아키텍처 기반

4세대 Tensor 코어

3세대 RT 코어

CUDA 코어

트랜스포머 엔진

효율성 및 보안

DLSS 3

워크로드

멀티 워크로드 가속화

생성형 AI

LLM 훈련 및 추론

렌더링 및 3D 그래픽

NVIDIA Omniverse

NVIDIA OVX L40S

성능

획기적인 성능

이미지 생성형 AI

대규모 언어 모델(LLM) 추론

사양

NVIDIA L40S GPU

시작하기

구매할 준비가 되셨나요?

적합한 제품 또는 파트너를 선택하는 데 도움이 필요하신가요?

최신 뉴스를 받아보세요

이메일로 출시 알림 받아보기

NVIDIA L40S GPU 사양