This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

GPU NVIDIA A2 con Tensor Core

La GPU básica que lleva la IA de NVIDIA a cualquier servidor.

Inferencia básica y versátil

La GPU NVIDIA A2 con Tensor Core proporciona inferencia básica con baja potencia, un tamaño reducido y un alto rendimiento para la IA de NVIDIA en el perímetro. La GPU A2, con una tarjeta PCIe Gen4 de bajo perfil y capacidad para configurar la potencia de diseño térmico (TDP) entre 40 y 60 W, brinda una aceleración de inferencia versátil a cualquier servidor para la implementación a escala.

Descargar la hoja de datos de NVIDIA A2 (538 KB)

Descargar el resumen del producto NVIDIA A2 (362 KB)

Rendimiento de la inferencia de IA hasta 20 veces mayor

La inferencia de IA se implementa para mejorar la vida de los consumidores con experiencias inteligentes en tiempo real y para obtener información de billones de sensores y cámaras de punto final. En comparación con los servidores solo con CPU, los servidores perimetrales y básicos que cuentan con la GPU NVIDIA A2 con núcleo Tensor ofrecen hasta 20 veces más rendimiento de inferencia y mejoran al instante la capacidad de cualquier servidor de gestionar la IA moderna.

Visión artificial
(EfficientDet-DO)

Procesamiento del lenguaje natural
(BERT-Large)

Texto a voz
(Tacotron2 + Waveglow)

Comparisons of one NVIDIA A2 Tensor Core GPU versus a dual-socket Xeon Gold 6330N CPU

Configuración del sistema: [CPU: HPE DL380 Gen10 Plus, 2S Xeon Gold 6330N a 2,2 GHz, 512 GB de memoria DDR4]
PLN: BERT-Large (longitud de secuencia: 384, SQuAD: v1.1) | TensorRT 8.2, Precisión: INT8, BS:1 (GPU) | OpenVINO 2021.4, Precisión: INT8, BS:1 (CPU)
Texto a voz: Tacotron2 + Waveglow canalización de extremo a extremo (longitud de entrada: 128) | PyTorch 1.9, Precisión: FP16, BS:1 (GPU) | PyTorch 1.9, Precisión: FP32, BS:1 (CPU)
Visión artificial: EfficientDet-D0 (COCO, 512x512) | TensorRT 8.2, Precisión: INT8, BS:8 (GPU) | OpenVINO 2021.4, Precisión: INT8, BS:8 (CPU)

Mayor rendimiento de IVA para el
perímetro inteligente

Los servidores equipados con GPU NVIDIA A2 ofrecen hasta 1,3 veces más rendimiento en casos de uso de perímetro inteligente, incluidas ciudades inteligentes, fabricación y venta minorista. Las GPU NVIDIA A2 que ejecutan cargas de trabajo de IVA ofrecen implementaciones más eficientes, con una relación precio-rendimiento hasta 1,6 veces superior y un 10 por ciento más de eficiencia energética que las generaciones de GPU anteriores.

Rendimiento IVA (normalizado)

Configuración del sistema: [Supermicro SYS-1029GQ-TRT, 2S Xeon Gold 6240 a 2,6 GHz, 512 GB DDR4, 1x NVIDIA A2 O 1x NVIDIA T4] | Rendimiento medido con Deepstream 5.1. Redes: ShuffleNet-v2 (224x224), MobileNet-v2 (224x224). | La canalización ofrece rendimiento de extremo a extremo, con captura y decodificación de vídeo, preprocesamiento, procesamiento por lotes, inferencia y posprocesamiento.

Optimizada para cualquier servidor

La GPU NVIDIA A2 está optimizada para cargas de trabajo de inferencia e implementaciones en servidores de nivel de entrada limitados por el espacio y los requisitos térmicos, como el perímetro 5G y los entornos industriales. A2 ofrece un formato de bajo perfil que opera en una carcasa de bajo consumo, con una potencia de diseño térmico (TDP) desde 60 hasta 40 W, por lo que es idóneo para cualquier servidor.

Menor consumo y TDP configurable

En la vanguardia del rendimiento de inferencia de IA en la nube, el centro de datos y el perímetro

La inferencia de IA continúa impulsando la innovación revolucionaria en todos los sectores, incluidos los del Internet de consumo, atención médica y ciencias de la vida, servicios financieros, venta minorista, fabricación y supercomputación. El pequeño formato y el bajo consumo del A2, combinados con las GPU NVIDIA A100 y A30 con núcleo Tensor, ofrecen una cartera completa de inferencia de IA en la nube, el centro de datos y el perímetro. El A2 y la cartera de inferencia de IA de NVIDIA garantizan que las aplicaciones de IA se implementen con menos servidores y menos consumo, lo que resulta en información más rápida con costes sustancialmente más bajos.

Preparada para su uso en la empresa

NVIDIA AI Enterprise

NVIDIA AI Enterprise, una suite de software integral de IA y análisis de datos nativa de la nube, está certificado para ejecutarse en A2 en una infraestructura virtual basada en hipervisor con VMware vSphere. Esto permite administrar y escalar las cargas de trabajo de IA e inferencia en un entorno de nube híbrida.

Obtén más información sobre NVIDIA AI Enterprise

A30 con MIG maximiza la utilización de infraestructura acelerada por GPU

NVIDIA-Certified Systems convencionales

NVIDIA-Certified Systems™ con NVIDIA A2 introduce la aceleración informática y las redes NVIDIA seguras de alta velocidad en los servidores de centros de datos empresariales que los partners OEM de NVIDIA fabrican y venden. Este programa permite a los clientes identificar, adquirir e implementar sistemas para aplicaciones de IA modernas, tradicionales y diversas del catálogo NVIDIA NGC™ en una única infraestructura escalable, rentable y de alto rendimiento.

Obtén más información sobre NVIDIA-Certified Systems

Con tecnología de la arquitectura NVIDIA Ampere

La arquitectura NVIDIA Ampere está diseñada para la era de la informática elástica y ofrece el rendimiento y la aceleración necesarios para impulsar las aplicaciones empresariales modernas. Explora el corazón de los centros de datos elásticos de mayor rendimiento del mundo.

Obtén más información sobre la arquitectura NVIDIA Ampere

Especificaciones técnicas

FP32	4,5
Núcleo Tensor TF32	9 \| 18*
Núcleo Tensor BFLOAT16	18 \| 36*
Núcleo Tensor FP16	18 \| 36*
Núcleo Tensor INT8	36 \| 72*
Núcleo Tensor INT4	72 \| 144*
Núcleo RT	10
Codificación y descodificación	1 codificador 2 descodificadores (+descodificación AV1)
Memoria de la GPU	GDDR6 de 16 GB
Ancho de banda de memoria de la GPU	200 GB/s
Interconexión	PCIe Gen 4 (x8)
Formatos	PCIe Gen4: 64 GB/s PCIe de perfil bajo de 1 ranura
Potencia máxima de diseño térmico (TDP)	40–60 W (configurable)
Soporte técnico del software de GPU virtual (vGPU)	14,0

¹ Con dispersión
² Compatible con futuras versiones de vGPU

En el interior de la arquitectura NVIDIA Ampere

Explore las tecnologías de vanguardia de la arquitectura NVIDIA Ampere.

Más información