NVIDIA A800 40GB Active 그래픽 카드

데이터 사이언스 및 HPC를 위한 최고의 워크스테이션 개발 플랫폼입니다.

구입처

NVIDIA 디자인 및 시각화 파트너를 찾아보세요.

파트너 찾기

데이터시트 | 명세서

소개

파트너 찾기

워크스테이션을 위한 슈퍼컴퓨팅 플랫폼

NVIDIA Ampere 아키텍처로 구동되는 NVIDIA® A800 40GB Active GPU는 NVIDIA AI Enterprise 소프트웨어가 포함된 최고의 워크스테이션 개발 플랫폼으로, 차세대 데이터 사이언스, AI, 데이터 분석 및 HPC 애플리케이션을 가속화하는 강력한 성능을 제공합니다.

NVIDIA A800 40GB Active 시작하기

NVIDIA A800 40GB Active(디스플레이용 컴패니언 GPU 포함)를 설정하고 NVIDIA AI Enterprise 라이선스를 활성화하는 방법을 알아보세요.

비디오 시청하기

하이라이트

업계 최고의 성능

이중 정밀도(FP64) 성능

9.7 TFLOPS¹

Tensor 성능

623.8 TFLOPS¹

메모리 대역폭

1.5 TB/초

¹ GPU 부스트 클럭을 기준으로 한 최고 속도.

특징

NVIDIA Ampere 아키텍처로 구동

3세대 Tensor 코어

이중 정밀도(FP64) 및 Tensor Float 32(TF32) 정밀도를 지원하는 광범위한 AI 및 HPC 애플리케이션에 대한 성능과 다양성은 이전 세대에 비해 최대 2배 향상된 성능과 효율성을 제공합니다. 구조적 희소성에 대한 하드웨어 지원은 추론 처리량을 두 배로 늘립니다.

멀티 인스턴스 GPU

전용 고대역폭 메모리, 캐시 및 컴퓨팅 코어를 통해 하드웨어 수준에서 완전히 격리되고 안전한 멀티 테넌시를 제공합니다. MIG(멀티 인스턴스 GPU)는 GPU 가속 인프라의 활용도를 극대화하여 A800 40GB Active GPU를 최대 7개의 독립 인스턴스로 분할하여 여러 사용자가 GPU 가속에 액세스할 수 있도록 합니다.

3세대 NVIDIA NVLink

GPU 간 인터커넥트 대역폭이 증가하여 컴퓨팅 워크로드를 가속화하고 더 큰 데이터 세트를 처리할 수 있는 확장 가능한 단일 메모리를 제공합니다. 한 쌍의 NVIDIA A800 40GB Active GPU를 NVIDIA NVLink®와 연결하여 유효 메모리 공간을 80GB로 늘리고 최대 400GB/s(양방향)의 속도로 GPU 간 데이터 전송을 지원하여 애플리케이션 성능을 확장하여 80GB 메모리의 여러 GPU로 확장할 수 있습니다.

초고속 HBM2 메모리

동급 최고의 1,555GB/초 메모리 대역폭(이전 세대에 비해 70% 이상 증가)을 갖춘 40GB의 고속 HBM2 메모리와 40MB 레벨 2 캐시를 포함하여 훨씬 더 많은 온칩 메모리로 엄청난 컴퓨팅 처리량을 제공합니다. 가장 컴퓨팅 집약적인 AI 및 HPC 워크로드를 가속화합니다.

NVIDIA Ampere GPU 아키텍처에 대해 자세히 알아보기

워크로드

산업 전반의 AI 및 HPC 워크플로우 가속화

생성형 AI

신경망을 사용하여 기존 데이터 내의 패턴과 구조를 식별하는 생성형 AI 애플리케이션은 사용자가 이미지, 사운드, 애니메이션, 3D 모델 등 다양한 입력과 출력에서 새롭고 독창적인 콘텐츠를 생성할 수 있도록 지원합니다. 쉽고 빠르며 커스터마이징 가능한 생성형 AI 모델 개발을 위해 NVIDIA AI Enterprise에 포함된 NVIDIA의 생성형 AI 솔루션인 NeMo™ 프레임워크와 A800 40GB Active GPU를 활용하세요.

Montage of a sunset view, a protein, and a toy Jensen.

엔지니어링 시뮬레이션/CAE

A800 40GB Active GPU는 GPU 가속 컴퓨터 지원 엔지니어링(CAE) 애플리케이션을 위한 놀라운 성능을 제공합니다. 엔지니어링 분석가와 CAE 전문가는 대규모 시뮬레이션과 엔지니어링 분석 코드를 놀라운 속도로 전체 FP64 정밀도로 실행하여 개발 일정을 단축하고 수익 창출 시간을 단축할 수 있습니다.

사전 및 사후 처리를 위한 디스플레이 기능을 제공하는 RTX 가속 GPU를 추가하여 디자이너와 엔지니어는 대규모 시뮬레이션과 모델을 완전한 디자인 충실도로 시각화할 수 있습니다.

Simulated image of an engine — Image credit: Dassault Systèmes

데이터 사이언스 및 데이터 분석

강력한 성능으로 엔드투엔드 데이터 사이언스 및 분석 워크플로우를 가속화하여 대규모 데이터 세트에서 의미 있는 인사이트를 빠르게 추출하세요. 데이터 실무자는 A800 40GB Active의 고성능 컴퓨팅 성능과 NVIDIA AI Enterprise를 결합하여 방대한 라이브러리, 도구 및 기술을 활용하여 데이터 준비 및 분석에서 모델링에 이르는 데이터 사이언스 워크플로우를 가속화할 수 있습니다.

Computer accessing a data base and extracting insights.

AI 트레이닝 및 추론

데이터센터 및 클라우드 기반 컴퓨팅 리소스를 오프로드하고 슈퍼컴퓨팅 성능을 데스크톱으로 가져와 로컬 AI 교육 및 추론 워크로드를 처리하세요. 4개의 A800 40GB 액티브 GPU가 탑재된 강력한 워크스테이션은 2.5페타플롭스 이상의 AI 컴퓨팅 성능과 160GB의 HBM2 메모리를 제공합니다.

Process of taking an LLM, optimizing it, and deploying an end solution.

AI 플랫폼

NVIDIA AI Enterprise를 통한 프로덕션-레디 AI

즉시 사용 가능한 AI 개발

각 NVIDIA A800 40GB Active GPU에는 프로덕션 준비가 완료된 생성형 AI, 컴퓨터 비전, 음성 AI 등의 신속한 개발 및 배포를 위한 엔드투엔드 엔터프라이즈 소프트웨어 플랫폼인 NVIDIA AI Enterprise의 3년 구독권이 함께 제공됩니다. 소프트웨어 활성화가 필요합니다.

가속화된 데이터 파이프라인

NVIDIA AI 엔터프라이즈에는 인사이트 도출 시간을 단축하는 데이터 사이언스 라이브러리 및 도구가 포함되어 있습니다. 조직은 Apache Spark용 NVIDIA RAPIDS™ 가속기를 사용하여 데이터 처리 시간을 최대 5배까지 가속화하는 동시에 운영 비용을 4배까지 절감할 수 있으며, 50배 빠른 엔드투엔드 데이터 사이언스 파이프라인을 위한 NVIDIA RAPIDS™를 사용할 수 있습니다.

AI 훈련 및 추론

NVIDIA AI Enterprise는 데이터 준비 및 모델 트레이닝부터 추론 및 대규모 배포에 이르기까지 AI 여정의 모든 단계를 가속화합니다:

NVIDIA TAO로 사전 훈련된 모델에 액세스
NVIDIA® TensorRT로 추론 최적화
NVIDIA Triton™ Inference Server로 대규모 배포

NVIDIA AI 엔터프라이즈에 대해 자세히 알아보기

성능

복잡한 AI 및 HPC 워크로드 처리

NVIDIA A800 40GB Active GPU는 AI 교육 및 추론부터 복잡한 시뮬레이션, 모델링, 데이터 분석에 이르기까지 워크스테이션 플랫폼에서 가장 복잡한 워크플로우를 처리할 수 있는 놀라운 성능을 제공합니다. 이전 세대보다 2배 이상 향상된 성능을 갖춘 A800 40GB Active는 광범위한 컴퓨팅 집약적 워크로드를 완벽하게 지원합니다.

AI Training - ResNet-50 V1.5

ResNet-50 V1.5 Training. Batch Size=256; Precision=Mixed.

AI Training - BERT - Large

BERT Large Pre-Training Phase 2 Batch Size=8; Precision=Mixed.

HPC - GTC

GTC Version 4.5, TAE, Precision=FP32.

HPC - LAMMPS

LAMMPS patch_8Feb2023, Atomic Fluid Lennard-Jones 2.5 (cutoff); Precision=FP64.

AI Inference - ResNet-50 V1.5

ResNet-50 V1.5 Inference. Batch Size=128; Precision=Mixed.

AI Inference - BERT - Large

BERT Large Inference. Batch Size=128; Precision=INT8.

A800 40GB Active 및 Quadro GV100 GPU와 Intel Xeon Gold 6126 프로세서를 사용한 성능 테스트.

데스크탑 워크스테이션의 슈퍼컴퓨팅 성능

슈퍼컴퓨터의 성능을 데스크톱에 제공하는 NVIDIA RTX™ 기반 AI 워크스테이션으로 데이터 센터 리소스에 대한 수요를 줄여보세요. 최신 NVIDIA RTX GPU가 장착된 워크스테이션 플랫폼은 차세대 AI 증강 애플리케이션 및 모델을 구축, 훈련 및 배포할 수 있는 강력한 AI 성능을 제공합니다. 세계에서 가장 진보된 AI 플랫폼을 사용하여 개발, 훈련, 추론 워크로드를 가속화하고 대규모 배포를 단순화하세요.

NVIDIA RTX 기반 AI 워크스테이션에 대해 자세히 알아보기

사양