NVIDIA L4 Tensor 코어 GPU

효율적인 비디오, AI 및 그래픽을 위한 획기적인 범용 가속기.

비디오, AI 및 그래픽 워크로드 가속화

NVIDIA Ada Lovelace 아키텍처 기반의 NVIDIA L4 Tensor 코어 GPU는 비디오, AI, 비주얼 컴퓨팅, 그래픽, 가상화 등을 위한 범용적이고 에너지 효율적인 가속화를 제공합니다. 로우 프로파일 폼 팩터로 패키징된 L4는 엣지에서 데이터센터, 클라우드에 이르기까지 모든 서버에서 높은 처리량과 낮은 지연 시간을 제공하는 비용 효율적이고 에너지 효율적인 솔루션입니다.

Up to 120X Higher AI Video Performance

L4는 최대 120배 더 높은 AI 비디오 성능을 제공합니다.

측정된 성능: 8x L4 대 2S Intel 8362 CPU 서버 비교, CV-CUDA® 디코딩을 사용한 엔드 투 엔드 비디오 파이프라인, 전처리, 추론(SegFormer), 후처리, 인코딩, OpenCV 4.7을 사용하는 NVIDIA® TensorRT™ 8.6 대 CPU 전용 파이프라인, PyTorch 추론.

실시간 AI 비디오 파이프라인 성능 경험하기

NVIDIA L4의 성능으로 비디오 애플리케이션을 혁신하세요. L4가 장착된 서버는 수백만 명의 시청자에게 라이브 스트리밍하거나 사용자가 창의적인 스토리를 만들 수 있도록 하거나 몰입형 증강 및 가상 현실(AR/VR) 경험을 제공할 때 모바일 사용자를 위해 720p30에서 최대 1,040개의 동시 AV1 비디오 스트림을 호스팅할 수 있습니다.¹

4세대 텐서 코어와 1.5배 더 큰 GPU 메모리를 갖춘 NVIDIA L4 GPU는 CV-CUDA® 라이브러리와 결합하여 비디오 콘텐츠 이해 성능을 새로운 차원으로 끌어올립니다. L4는 CPU 기반 솔루션보다 120배 더 높은 AI 비디오 성능을 제공하므로 기업은 실시간 인사이트를 확보하여 콘텐츠를 개인화하고, 검색 관련성을 개선하고, 불쾌한 콘텐츠를 감지하고, 스마트 공간 솔루션을 구현할 수 있습니다.

1. 측정된 성능: 720p30에서 8x L4 AV1 저지연 P1 프리셋 인코딩.

L4로 에너지와 공간 절약

AI와 비디오가 더욱 널리 보급됨에 따라 효율적이고 비용 효율적인 컴퓨팅에 대한 수요가 그 어느 때보다 증가하고 있습니다. NVIDIA L4 Tensor 코어 GPU는 최대 120배 더 뛰어난 AI 비디오 성능을 제공하여 기존 CPU 기반 인프라에 비해 최대 99% 더 나은 에너지 효율과 더 낮은 총 유지 비용을 자랑합니다. 이를 통해 기업은 랙 공간을 줄이고 탄소 발자국을 크게 줄이면서 데이터센터를 더 많은 사용자에 맞게 확장할 수 있습니다. 2메가와트(MW) 데이터센터에서 CPU에서 NVIDIA L4로 전환하여 절약되는 에너지는 거의 2,000가구에 1년간 전력을 공급하거나 10년간 172,000그루의 나무를 심어 탄소 배출량을 상쇄할 수 있는 양과 같습니다.²

 

2. 1.677MW 절감을 사용한 EPA 계산기 결과.

더 나은 에너지 효율성

L4는 최대 99% 향상된 에너지 효율성 제공

8x L4 대 2S Intel 8362 CPU 서버 TCO 비교: CV-CUDA 전처리 및 후처리, 디코딩, 추론(SegFormer), 인코딩, TRT 8.6이 포함된 엔드 투 엔드 비디오 파이프라인 대 OpenCV 4.7, PyTorch를 사용하는 CPU 전용 파이프라인 추론.

생성형 AI 성능 가속화

최대 2.5배 더 높은 생성형 AI 성능

L4는 최대 2.5배 더 높은 생성 AI 성능을 제공합니다.

예상 성능: L4 대 T4 이미지 생성, 512x512 안정적인 확산 v2.1, FP16, TensorRT 8.5.2.

이미지와 텍스트를 위한 생성형 AI는 모든 산업에서 고객의 삶을 더욱 편리하게 만들고 몰입감 넘치는 경험을 제공합니다. NVIDIA L4는 이전 GPU 세대에 비해 최대 2.5배 더 높은 성능을 제공하여 컴퓨팅 집약적인 생성형 AI 추론을 강화합니다. 또한 50% 더 많은 메모리 용량을 갖춘 L4는 이전 GPU 세대에서는 불가능했던 최대 1024x768의 더 큰 이미지를 생성할 수 있습니다.


그래픽 성능 최적화

4배 이상의 실시간 렌더링 및 3배 이상의 레이 트레이싱 성능

L4는 AI 기반 아바타에 대해 4배 이상 높은 렌더링 성능을 제공합니다.

측정된 성능:
실시간 렌더링: NVIDIA Deep Learning Super를 통해 1080p 및 4K에서 실시간 렌더링을 위한 NVIDIA Omniverse™ 성능 샘플링(DLSS) 3.
레이 트레이싱: 레이 트레이싱 및 DLSS 3를 지원하는 AAA 타이틀의 게임 성능 기하 평균.

3세대 RT 코어와 AI 기반 NVIDIA 딥러닝 슈퍼 샘플링 3(DLSS 3)를 통해 NVIDIA L4는 AI 기반 아바타, NVIDIA Omniverse™ 가상 세계, 클라우드 게임 및 가상 워크스테이션에 대해 4배 이상 높은 성능을 제공합니다. 이러한 기능을 통해 크리에이터는 CPU로는 불가능한 몰입형 시각적 경험을 위한 실시간 영화 품질의 그래픽과 장면을 구축할 수 있습니다.

효율적이고 지속 가능한 워크로드 가속화

NVIDIA L4는 NVIDIA 데이터센터 플랫폼의 필수적인 부분입니다. 비디오, AI, NVIDIA RTX™ 가상 워크스테이션(vWS), 그래픽, 시뮬레이션, 데이터 과학 및 데이터 분석을 위해 구축된 이 플랫폼은 3,000개 이상의 애플리케이션을 가속화하며 데이터센터부터 엣지, 클라우드에 이르기까지 모든 곳에서 대규모로 사용할 수 있어 극적인 성능 향상과 에너지 효율성 기회를 모두 제공합니다.

메인스트림 배포에 최적화된 L4는 72W 저전력 범위에서 작동하는 로우 프로파일 폼 팩터를 제공하므로 NVIDIA 파트너 에코시스템의 모든 서버 또는 클라우드 인스턴스에 효율적이고 비용 효율적인 솔루션이 될 수 있습니다.

Enterprise-Ready AI 소프트웨어로 개발 및 배포 간소화

AI 개발 및 배포를 간소화하도록 최적화된 NVIDIA AI 엔터프라이즈 소프트웨어 제품군에는 일반적인 데이터센터 플랫폼 및 NVIDIA L4 GPU가 탑재된 메인스트림 NVIDIA 인증 시스템™에서 실행되도록 인증된 AI 솔루션 워크플로우, 프레임워크, 사전 학습된 모델 및 인프라 최적화가 포함되어 있습니다.

NVIDIA AI 엔터프라이즈는 거의 모든 조직에서 트레이닝, 추론 및 데이터 사이언스 분야에서 최고의 성능으로 AI에 액세스할 수 있도록 지원하는 NVIDIA L4 GPU용 라이선스 추가 제품입니다. NVIDIA AI Enterprise는 NVIDIA L4와 함께 AI 지원 플랫폼 구축을 간소화하고, AI 개발 및 배포를 가속화하며, 성능, 보안 및 확장성을 제공하여 인사이트를 더 빠르게 수집하고 비즈니스 가치를 더 빨리 달성할 수 있도록 지원합니다.

주요 L4 고객사

제품 사양

폼 팩터 L4
FP32 30.3 teraFLOPs
TF32 Tensor 코어 120 teraFLOPS*
FP16 Tensor 코어 242 teraFLOPS*
BFLOAT16 Tensor 코어 242 teraFLOPS*
FP8 Tensor 코어 485 teraFLOPs*
INT8 Tensor 코어 485 TOPs*
GPU 메모리 24GB
GPU 메모리 대역폭 300GB/s
NVENC | NVDEC | JPEG 디코더 2 | 4 | 4
최대 열 설계 전력(TDP) 72W
폼 팩터 1슬롯 로우 프로파일, PCIe
인터커넥트 PCIe Gen4 x16 64GB/s
서버 옵션 1~8개의 GPU를 갖춘 파트너 및 NVIDIA 인증 시스템

* 희소성으로 표시됩니다. 희소성 없는 사양은 절반으로 낮습니다.

Google Cloud에서 L4 얼리 액세스를 시작하세요.