GPU NVIDIA A2 с тензорными ядрами

GPU начального уровня, позволяющий использовать ИИ NVIDIA на любом сервере.

Инференс начального уровня

Компактный графический процессор NVIDIA A2 с тензорными ядрами обеспечивает инференс начального уровня с низким энергопотреблением и высокой производительностью для ИИ NVIDIA на периферийных устройствах. Благодаря шине PCIe Gen4 и настраиваемой мощности теплоотвода (TDP) от 40 до 60 Вт низкопрофильная карта A2 обеспечивает универсальное ускорение инференса на любом сервере.

Повышение производительности инференса ИИ до 20 раз

В результате инференса ИИ компании улучшают клиентский опыт и извлекают ценные данные из информации, поступающей с камер и датчиков в реальном времени. По сравнению с серверами на базе CPU edge-серверы и серверы начального уровня на базе графических процессоров NVIDIA A2 с тензорными ядрами обеспечивают до 20 раз большую производительность инференса и наращивают функциональные возможности для задач современного ИИ.

Компьютерное зрение
(EfficientDet-DO)

Обработка естественного языка
(BERT-Large)

Преобразование текста в речь
(Tacotron2 + Waveglow)

Comparisons of one NVIDIA A2 Tensor Core GPU versus a dual-socket Xeon Gold 6330N CPU

Высокая производительность в задачах IVA
на периферийных устройствах

Серверы, оснащенные графическими процессорами NVIDIA A2, обеспечивают до 1,3 раза большую производительность в edge-исполнении для задач умных городов, промышленности и ритейла. Для задач IVA графические процессоры NVIDIA A2 обеспечивают оптимальное развертывание, до 1,6 раз лучшее соотношение цены и производительности и на 10 процентов более высокую энергоэффективность по сравнению с предыдущими поколениями GPU.

Производительность IVA (стандартизована)

Производительность IVA (стандартизована)

Оптимизация для любого сервера

NVIDIA A2 оптимизирован для задач инференса и развертывания на серверах начального уровня в средах с ограниченным пространством и повышенными требованиями к охлаждению, например для периферийных вычислений 5G и промышленных задач. Компактный и энергоэффективный корпус A2 с показателями по теплоотводу от 40 до 60 Вт подходит для установки в любые системы.  

Низкое энергопотребление и настраиваемая мощность TDP

Низкое энергопотребление и настраиваемая мощность TDP

Ведущая производительность инференса ИИ в облаке, дата-центре и на периферийных устройствах

Инференс ИИ продолжает приносить впечатляющие результаты в различных отраслях, включая потребительский сектор Интернета, здравоохранение, медико-биологические науки, финансовые услуги, розничную торговлю, промышленность и суперкомпьютерные вычисления. GPU A2 в компактном форм-факторе и с низким энергопотреблением дополняют NVIDIA A100 и A30 и вместе составляют полноценное портфолио решений для инференса ИИ в облаке, дата-центре и на периферийных устройствах. A2 и линейка решений для инференса позволят развернуть решение ИИ на меньшем количестве серверов и с низким энергопотреблением. Это позволяет быстрее получать результаты и существенно снизить затраты.

Ведущая производительность инференса ИИ в облаке, дата-центре и на периферийных устройствах

Развертывание на предприятии

NVIDIA AI Enterprise

NVIDIA AI Enterprise, комплексный пакет ПО с поддержкой облака для ИИ и анализа данных, сертифицирован для работы на A2 в виртуальной инфраструктуре на базе гипервизораVMware vSphere. Это позволяет управлять задачами ИИ и инференса и масштабировать их в гибридной облачной среде.

Подробнее о NVIDIA AI Enterprise ›

A30 с технологией Multi-Instance GPU (MIG) обеспечивает максимальную утилизацию инфраструктуры с ускорением на GPU.
A30 с технологией Multi-Instance GPU (MIG) обеспечивает максимальную утилизацию инфраструктуры с ускорением на GPU.

Популярные сертифицированные NVIDIA системы

NVIDIA-Certified Systems™ (сертифицированные NVIDIA системы) и NVIDIA A2 позволяют обеспечить ускорение вычислений и высокоскоростную передачу данных по сети в серверах дата-центров, построенных и реализуемых партнерами NVIDIA. Программа позволяет приобретать и развертывать системы для традиционных и современных приложений для работы с ИИ из каталога NVIDIA NGC™ в единой высокопроизводительной, экономичной и масштабируемой инфраструктуре.

Подробнее о сертифицированных NVIDIA системах ›

На базе архитектуры NVIDIA Ampere

Разработанная для эластичных вычислений архитектура NVIDIA Ampere обеспечивает непревзойденную производительность и ускорение, необходимые для работы современных приложений. Сердце самых производительных и гибких дата-центров.

Подробнее об архитектуре NVIDIA Ampere ›

A30 с технологией Multi-Instance GPU (MIG) обеспечивает максимальную утилизацию инфраструктуры с ускорением на GPU.

Технические спецификации

Peak FP32 4.5 TF
TF32 Tensor Core 9 TF | 18 TF¹
BFLOAT16 Tensor Core 18 TF | 36 TF¹
Peak FP16 Tensor Core 18 TF | 36 TF¹
Peak INT8 Tensor Core 36 TOPS | 72 TOPS¹
Peak INT4 Tensor Core 72 TOPS | 144 TOPS¹
RT Cores 10
Media engines 1 video encoder
2 video decoders (includes AV1 decode)
GPU memory 16GB GDDR6
GPU memory bandwidth 200GB/s
Interconnect PCIe Gen4 x8
Form factor 1-slot, low-profile PCIe
Max thermal design power (TDP) 40–60W (configurable)
Virtual GPU (vGPU) software support² NVIDIA Virtual PC (vPC), NVIDIA Virtual Applications (vApps), NVIDIA RTX Virtual Workstation (vWS), NVIDIA AI Enterprise, NVIDIA Virtual Compute Server (vCS)

Инновации в архитектуре NVIDIA Ampere

Исследуйте инновации архитектуры и полную линейку графических процессоров на ее базе.