Los Tensor Cores permiten la computación de precisión mixta, con una adaptación dinámica de los cálculos para acelerar el rendimiento al tiempo que preservan la precisión y proporcionan una mayor seguridad. La última generación de Tensor Cores es más rápida que nunca en una amplia gama de tareas de IA y computación de alto rendimiento (HPC). Los Tensor Cores de NVIDIA aceleran todas las cargas de trabajo de las modernas fábricas de IA, desde aceleraciones cuatro veces mayores en el entrenamiento de los modelos de IA generativa de billones de parámetros hasta un aumento de 45 veces en el rendimiento de la inferencia.
La arquitectura Blackwell multiplica por 30 la velocidad en comparación con la generación anterior de NVIDIA Hopper™ para modelos masivos como GPT-MoE-1.8T. Este aumento del rendimiento es posible gracias a la quinta generación de Tensor Cores. Los Tensor Cores de Blackwell añaden nuevas precisiones, incluidos los formatos de microescalado definidos por la comunidad, lo que proporciona una mayor precisión y facilidad de sustitución para precisiones superiores.
A medida que los modelos de IA generativa aumentan en tamaño y complejidad, es fundamental mejorar el rendimiento del entrenamiento y la inferencia. Para satisfacer estas necesidades de computación, los Tensor Cores de Blackwell admiten nuevos formatos de cuantificación y precisiones, incluidos los formatos de microescalado definidos por la comunidad.
Desde la introducción de la tecnología Tensor Core, las GPU NVIDIA Hopper han multiplicado por 60 su rendimiento máximo, lo que impulsa la democratización de la computación para la IA y HPC. La arquitectura de NVIDIA Hopper hace avances en los Tensor Cores de cuarta generación con el motor transformador utilizando FP8 para proporcionar 6 veces más rendimiento que FP16 en el entrenamiento de modelos de billones de parámetros. Junto con un rendimiento 3 veces mayor con precisiones de TF32, FP64, FP16 e INT8, los Tensor Cores de Hopper ofrecen las aceleraciones más elevadas en todas las cargas de trabajo.
Los Tensor Cores son componentes esenciales de la solución completa para centros de datos de NVIDIA que incorpora hardware, redes, software, bibliotecas y modelos y aplicaciones de IA optimizados del catálogo NVIDIA NGC™ . La plataforma de IA y HPC integral más potente, permite a los investigadores obtener resultados reales e implementar soluciones en producción a escala.
Blackwell | Hopper | |
---|---|---|
Precisiones compatibles con Tensor Core | FP64, TF32, BF16, FP16, FP8, INT8, FP6, FP4 | FP64, TF32, BF16, FP16, FP8, INT8 |
Precisiones compatibles con CUDA® Core | FP64, FP32, FP16, BF16 | FP64, FP32, FP16, BF16, INT8 |
*Las especificaciones preliminares pueden estar sujetas a cambios
Más información sobre NVIDIA Blackwell.