Entrenar modelos de IA para desafíos de siguiente nivel, como la IA conversacional, requiere una capacidad enorme de potencia de computación y escalabilidad.
NVIDIA A30 Tensor Cores con Tensor Float (TF32) tiene un rendimiento hasta 10 veces mayor que el de NVIDIA T4, sin cambios de código, y una aceleración adicional duplicada con precisión mixta automática y FP16, de manera que la mejora combinada es 20 veces superior. Al combinarse con NVIDIA® NVLink®, PCIe Gen4, el sistema de red NVIDIA Mellanox® y el SDK NVIDIA Magnum IO™, es posible escalar a miles de GPU.
Tensor Cores y MIG permiten que el A30 se use para cargas de trabajo dinámicamente durante todo el día. Se puede utilizar para la inferencia de producción en momentos de máxima demanda, y parte de la GPU se puede reutilizar para volver a entrenar rápidamente esos mismos modelos durante las horas de menor actividad.
NVIDIA ha batido varios récords de rendimiento en MLPerf, el índice de referencia del sector para el entrenamiento de IA.