GPU NVIDIA A2 con Tensor Core

La GPU básica que lleva la IA de NVIDIA a cualquier servidor.

Inferencia básica y versátil

La GPU NVIDIA A2 con Tensor Core proporciona inferencia básica con baja potencia, un tamaño reducido y un alto rendimiento para la IA de NVIDIA en el perímetro. La GPU A2, con una tarjeta PCIe Gen4 de bajo perfil y capacidad para configurar la potencia de diseño térmico (TDP) entre 40 y 60 W, brinda una aceleración de inferencia versátil a cualquier servidor para la implementación a escala.

Rendimiento de la inferencia de IA hasta 20 veces mayor

La inferencia de IA se implementa para mejorar la vida de los consumidores con experiencias inteligentes en tiempo real y para obtener información de billones de sensores y cámaras de punto final. En comparación con los servidores solo con CPU, los servidores perimetrales y básicos que cuentan con la GPU NVIDIA A2 con núcleo Tensor ofrecen hasta 20 veces más rendimiento de inferencia y mejoran al instante la capacidad de cualquier servidor de gestionar la IA moderna.

Visión artificial
(EfficientDet-DO)

Procesamiento del lenguaje natural
(BERT-Large)

Texto a voz
(Tacotron2 + Waveglow)

Comparisons of one NVIDIA A2 Tensor Core GPU versus a dual-socket Xeon Gold 6330N CPU

Mayor rendimiento de IVA para el
perímetro inteligente

Los servidores equipados con GPU NVIDIA A2 ofrecen hasta 1,3 veces más rendimiento en casos de uso de perímetro inteligente, incluidas ciudades inteligentes, fabricación y venta minorista. Las GPU NVIDIA A2 que ejecutan cargas de trabajo de IVA ofrecen implementaciones más eficientes, con una relación precio-rendimiento hasta 1,6 veces superior y un 10 por ciento más de eficiencia energética que las generaciones de GPU anteriores.

Rendimiento IVA (normalizado)

Rendimiento IVA (normalizado)

Optimizada para cualquier servidor

La GPU NVIDIA A2 está optimizada para cargas de trabajo de inferencia e implementaciones en servidores de nivel de entrada limitados por el espacio y los requisitos térmicos, como el perímetro 5G y los entornos industriales. A2 ofrece un formato de bajo perfil que opera en una carcasa de bajo consumo, con una potencia de diseño térmico (TDP) desde 60 hasta 40 W, por lo que es idóneo para cualquier servidor.  

Menor consumo y TDP configurable

Menor consumo y TDP configurable

En la vanguardia del rendimiento de inferencia de IA en la nube, el centro de datos y el perímetro

La inferencia de IA continúa impulsando la innovación revolucionaria en todos los sectores, incluidos los del Internet de consumo, atención médica y ciencias de la vida, servicios financieros, venta minorista, fabricación y supercomputación. El pequeño formato y el bajo consumo del A2, combinados con las GPU NVIDIA A100 y A30 con núcleo Tensor, ofrecen una cartera completa de inferencia de IA en la nube, el centro de datos y el perímetro. El A2 y la cartera de inferencia de IA de NVIDIA garantizan que las aplicaciones de IA se implementen con menos servidores y menos consumo, lo que resulta en información más rápida con costes sustancialmente más bajos.

En la vanguardia del rendimiento de inferencia de IA en la nube, el centro de datos y el perímetro

Preparada para su uso en la empresa

NVIDIA AI Enterprise

NVIDIA AI Enterprise, una suite de software integral de IA y análisis de datos nativa de la nube, está certificado para ejecutarse en A2 en una infraestructura virtual basada en hipervisor con VMware vSphere. Esto permite administrar y escalar las cargas de trabajo de IA e inferencia en un entorno de nube híbrida.

A30 con MIG maximiza la utilización de infraestructura acelerada por GPU
A30 con MIG maximiza la utilización de infraestructura acelerada por GPU

NVIDIA-Certified Systems convencionales

NVIDIA-Certified Systems™ con NVIDIA A2 introduce la aceleración informática y las redes NVIDIA seguras de alta velocidad en los servidores de centros de datos empresariales que los partners OEM de NVIDIA fabrican y venden. Este programa permite a los clientes identificar, adquirir e implementar sistemas para aplicaciones de IA modernas, tradicionales y diversas del catálogo NVIDIA NGC™ en una única infraestructura escalable, rentable y de alto rendimiento.

Con tecnología de la arquitectura NVIDIA Ampere

La arquitectura NVIDIA Ampere está diseñada para la era de la informática elástica y ofrece el rendimiento y la aceleración necesarios para impulsar las aplicaciones empresariales modernas. Explora el corazón de los centros de datos elásticos de mayor rendimiento del mundo.

A30 con MIG maximiza la utilización de infraestructura acelerada por GPU

Especificaciones técnicas

FP32 4,5
Núcleo Tensor TF32 9 | 18*
Núcleo Tensor BFLOAT16 18 | 36*
Núcleo Tensor FP16 18 | 36*
Núcleo Tensor INT8 36 | 72*
Núcleo Tensor INT4 72 | 144*
Núcleo RT 10 
Codificación y descodificación 1 codificador
2 descodificadores (+descodificación AV1)
Memoria de la GPU GDDR6 de 16 GB
Ancho de banda de memoria de la GPU 200 GB/s
Interconexión PCIe Gen 4 (x8)
Formatos PCIe Gen4: 64 GB/s
PCIe de perfil bajo de 1 ranura
Potencia máxima de diseño térmico (TDP) 40–60 W (configurable)
Soporte técnico del software de GPU virtual (vGPU) 14,0

En el interior de la arquitectura NVIDIA Ampere

Explore las tecnologías de vanguardia de la arquitectura NVIDIA Ampere.