성능 증폭
NVIDIA® RTX™ 플랫폼은 전문 비주얼 컴퓨팅을 완전히 바꾸어 버렸습니다. RTX 성능을 토대로 구축된 NVIDIA Ampere 아키텍처는 렌더링, 그래픽, AI, 컴퓨팅 워크로드의 성능을 크게 개선합니다. 완벽하게 엔지니어링되고 최첨단 혁신 기능을 갖춘 NVIDIA Ampere는 RTX를 한 단계 끌어올려 전문 워크로드를 처리합니다.
이전 세대에 비해 2배*에 달하는 처리량과 고급 음영 처리 또는 노이즈 제거와 함께 레이 트레이싱을 동시에 실행하는 기능을 갖춘 2세대 RT 코어는 영화 콘텐츠의 사실적인 렌더링, 제품 디자인의 가상 프로토타입 제작과 같은 워크로드에 엄청난 가속을 제공합니다. 이 기술은 레이 트레이싱 모션 블러의 렌더링 속도도 높여 더욱 뛰어난 시각적 정확도로 더욱 빠른 결과를 얻을 수 있습니다.
새로운 Tensor Float 32(TF32) 정밀도는 이전 세대에 비해 5배의 트레이닝 처리량을 제공하므로 코드를 변경하지 않아도 AI 및 데이터 사이언스 모델 트레이닝을 가속화합니다. 구조적 희소성에 대한 하드웨어 지원은 추론을 위한 처리량을 두 배로 높입니다. Tensor 코어는 또한 DLSS, AI 노이즈 제거 및 일부 애플리케이션에 대한 향상된 편집 기능과 같은 기능을 통해 그래픽에도 AI를 지원합니다.
NVIDIA Ampere 아키텍처의 CUDA® 코어는 이전 세대보다 단정밀도 부동 소수점(FP32) 연산 처리 속도가 2배 더 빠르고 전력 효율성도 2배 더 높습니다. 이를 통해 3D 모델 개발과 같은 그래픽 워크플로우의 성능과 CAE(Computer-Aided Engineering)를 위한 데스크톱 시뮬레이션과 같은 워크로드의 컴퓨팅 성능이 크게 향상됩니다.
NVIDIA Ampere 아키텍처 기반 GPU는 PCIe Gen 3.0의 대역폭보다 2배 더 큰 PCI Express Gen 4.0(PCIe Gen 4.0)를 지원합니다. AI 및 데이터 사이언스와 같은 데이터 집약적 작업에서는 CPU 메모리에서의 데이터 전송 속도를 향상시킵니다. 또한 더욱 빠른 PCIe 성능으로 GPU DMA(Direct Memory Access) 전송을 가속화하므로, GPUDirect® for Video 지원 디바이스에서 더 빠른 비디오 데이터 전송과 GPUDirect 스토리지를 통한 더 빠른 입출력(IO)이 가능합니다.
사용자는 3세대 NVIDIA NVLink® 기술로 두 개의 GPU를 연결하여 GPU 성능 및 메모리를 공유할 수 있습니다. 전문가들은 최대 112GB/s의 양방향 대역폭과 최대 96GB의 결합 그래픽 메모리를 통해 가장 큰 렌더링, AI, 가상 현실, 비주얼 컴퓨팅 워크로드를 처리할 수 있습니다. 또한 새로운 NVLink 커넥터는 Z 높이가 짧아 더욱 광범위한 섀시에서 NVLink 기능을 지원합니다.
NVIDIA Ampere 아키텍처 기반의 최신 RTX 제품을 확인해보세요.