Los Núcleos Tensor permiten la computación de precisión mixta, adaptando dinámicamente los cálculos para acelerar el rendimiento al tiempo que preserva la precisión y proporciona una seguridad mejorada. La última generación de Núcleos Tensor es más rápida que nunca en una amplia gama de tareas de IA y computación de alto rendimiento (HPC). Desde aceleraciones 4 veces mayores en el entrenamiento de modelos de IA generativa de billones de parámetros hasta un aumento de 45 veces en el rendimiento de inferencia, los Núcleos Tensor de NVIDIA aceleran todas las cargas de trabajo para las modernas AI factories.
La arquitectura Blackwell ofrece una aceleración 45 veces mayor en comparación con la generación anterior de NVIDIA Hopper™ para modelos masivos como GPT-MoE-1.8T. Este aumento de rendimiento es posible gracias a la quinta generación de Núcleos Tensor, que ofrece avances innovadores para IA generativa, análisis de datos y HPC. Los Núcleos Tensor de quinta generación introducen Nuevas Precisiones de microescalado (MX) FP4 junto con soporte para todas las precisiones de la comunidad, como MXFP8, MXFP6 y MXINT8.
A medida que los modelos de IA generativa aumentan en tamaño y complejidad, es fundamental mejorar el rendimiento del entrenamiento y la inferencia. Para satisfacer estas necesidades de computación, los Núcleos Tensor de Blackwell admiten todos los formatos de cuantificación comunitarios comunes, incluidos MXFP8, MXFP6, MXFP4 y MXINT8.
Desde la introducción de la tecnología Tensor Core, las GPU NVIDIA han aumentado su rendimiento máximo 60 veces, impulsando la democratización de la computación para IA y HPC. La arquitectura NVIDIA Hopper avanza los Núcleos Tensor de cuarta generación con Transformer Engine utilizando FP8 para ofrecer un rendimiento 6 veces mayor que FP16 para el entrenamiento de modelos de billones de parámetros. Combinado con 3 veces más rendimiento usando las precisiones TF32, FP64, FP16 e INT8, Núcleos Tensor Hopper ofrece aceleración para todas las cargas de trabajo.
Los Núcleos Tensor son componentes esenciales de la solución completa de data center de NVIDIA que incorpora hardware, redes, software, bibliotecas y modelos y aplicaciones de IA optimizados del catálogo NVIDIA NGC™. La plataforma de IA y HPC de extremo a extremo más potente, permite a los investigadores ofrecer resultados del mundo real e implementar soluciones en producción a escala.
Blackwell | Hopper | |
---|---|---|
Precisiones de Núcleo Tensor admitidas | FP64, TF32, BF16, FP16, FP8, INT8, FP6, FP4 | FP64, TF32, BF16, FP16, FP8, INT8 |
Precisiones de Núcleo CUDA® compatibles | FP64, FP32, FP16, BF16 | FP64, FP32, FP16, BF16, INT8 |
*Especificaciones preliminares, pueden estar sujetas a cambios.
¿Interesado en NVIDIA Blackwell?