신경망을 사용하여 기존 데이터 내의 패턴과 구조를 식별하는 생성형 AI 애플리케이션은 사용자가 이미지, 사운드, 애니메이션, 3D 모델 등 다양한 입력과 출력에서 새롭고 독창적인 콘텐츠를 생성할 수 있도록 지원합니다. 쉽고 빠르며 커스터마이징 가능한 생성형 AI 모델 개발을 위해 NVIDIA AI Enterprise에 포함된 NVIDIA의 생성형 AI 솔루션인 NeMo™ 프레임워크와 A800 40GB Active GPU를 활용하세요.
NVIDIA Ampere 아키텍처로 구동되는 NVIDIA® A800 40GB Active GPU는 NVIDIA AI Enterprise 소프트웨어가 포함된 최고의 워크스테이션 개발 플랫폼으로, 차세대 데이터 사이언스, AI, 데이터 분석 및 HPC 애플리케이션을 가속화하는 강력한 성능을 제공합니다.
9.7 TFLOPS¹
623.8 TFLOPS¹
1.5 TB/초
1 GPU 부스트 클럭을 기준으로 한 최고 속도.
NVIDIA A800 40GB Active GPU는 AI 교육 및 추론부터 복잡한 시뮬레이션, 모델링, 데이터 분석에 이르기까지 워크스테이션 플랫폼에서 가장 복잡한 워크플로우를 처리할 수 있는 놀라운 성능을 제공합니다. 이전 세대보다 2배 이상 향상된 성능을 갖춘 A800 40GB Active는 광범위한 컴퓨팅 집약적 워크로드를 완벽하게 지원합니다.
ResNet-50 V1.5 Training. Batch Size=256; Precision=Mixed.
BERT Large Pre-Training Phase 2 Batch Size=8; Precision=Mixed.
GTC Version 4.5, TAE, Precision=FP32.
LAMMPS patch_8Feb2023, Atomic Fluid Lennard-Jones 2.5 (cutoff); Precision=FP64.
ResNet-50 V1.5 Inference. Batch Size=128; Precision=Mixed.
BERT Large Inference. Batch Size=128; Precision=INT8.
A800 40GB Active 및 Quadro GV100 GPU와 Intel Xeon Gold 6126 프로세서를 사용한 성능 테스트.
슈퍼컴퓨터의 성능을 데스크톱에 제공하는 NVIDIA RTX™ 기반 AI 워크스테이션으로 데이터 센터 리소스에 대한 수요를 줄여보세요. 최신 NVIDIA RTX GPU가 장착된 워크스테이션 플랫폼은 차세대 AI 증강 애플리케이션 및 모델을 구축, 훈련 및 배포할 수 있는 강력한 AI 성능을 제공합니다. 세계에서 가장 진보된 AI 플랫폼을 사용하여 개발, 훈련, 추론 워크로드를 가속화하고 대규모 배포를 단순화하세요.
GPU 메모리 | 40GB HBM2 |
메모리 인터페이스 | 5,120비트 |
메모리 대역폭 | 1,555.2GB/초 |
CUDA 코어 | 6,912 |
Tensor 코어 | 432 |
이중 정밀도 성능 | 9.7 TFLOPS |
단정밀도 성능 | 19.5 TFLOPS |
최고 Tensor 성능 | 623.8 TFLOPS |
멀티 인스턴스 GPU | 5GB에서 최대 7개의 MIG 인스턴스 |
NVIDIA NV링크 | 예 |
NVLink 대역폭 | 400GB/초 |
그래픽 버스 | PCIe 4.0x16 |
최대 전력 소비 | 240 W |
열 | 활성화 |
폼 팩터 | 4.4인치 H x 10.5인치 L, 듀얼 슬롯 |
디스플레이 기능* | - |
*A800 40GB Active에는 디스플레이 포트가 장착되어 있지 않습니다. 디스플레이 출력 기능을 지원하려면 NVIDIA RTX 4000 Ada Generation, NVIDIA RTX A4000 또는 NVIDIA T1000 GPU가 필요합니다. |