Os Núcleos Tensor permitem computação de precisão mista, adaptando cálculos dinamicamente para acelerar o rendimento, preservando a precisão e fornecendo segurança aprimorada. A última geração de Núcleos Tensor está mais rápida do que nunca em uma ampla gama de tarefas de IA e computação de alto desempenho (HPC). Desde acelerações de 4 vezes no treinamento de modelos de IA generativa de trilhões de parâmetros até aumento de 45 vezes no desempenho de inferência, os Núcleos Tensor da NVIDIA aceleram todas as cargas de trabalho para modernas AI factories.
A arquitetura Blackwell oferece uma aceleração de 45 vezes em comparação com a geração anterior NVIDIA Hopper™ para modelos massivos como o GPT-MoE-1.8T. Esse aumento de desempenho é possível com a quinta geração de Núcleos Tensor, que oferece avanços inovadores para IA generativa, análise de dados e HPC. Os Núcleos Tensor de quinta geração introduzem novas precisões de microescalonamento (MX) FP4 junto com suporte para todas as precisões da comunidade, como MXFP8, MXFP6 e MXINT8.
À medida que os modelos de IA generativa explodem em tamanho e complexidade, é fundamental melhorar o desempenho do treinamento e da inferência. Para atender a essas necessidades de computação, os Núcleos Tensor Blackwell suportam todos os formatos comuns de quantização da comunidade, incluindo MXFP8, MXFP6, MXFP4 e MXINT8.
Desde a introdução da tecnologia de Núcleo Tensor, as GPUs NVIDIA aumentaram seu desempenho máximo em 60 vezes, alimentando a democratização da computação para IA e HPC. A arquitetura NVIDIA Hopper avança com Núcleos Tensor de quarta geração com o Transformer Engine usando FP8 para oferecer desempenho 6 vezes maior em relação ao FP16 para treinamento de modelo de trilhões de parâmetros. Combinados com 3 vezes mais desempenho usando as precisões TF32, FP64, FP16 e INT8, os Núcleos Tensor Hopper oferecem aceleração para todas as cargas de trabalho.
Núcleos Tensor são componentes essenciais da solução completa de data center da NVIDIA que incorpora hardware, rede, software, bibliotecas e modelos e aplicações de IA otimizados do catálogo NVIDIA NGC™. A plataforma de ponta a ponta mais poderosa de IA e HPC permite que os pesquisadores forneçam resultados reais e implantem soluções em produção em escala.
Blackwell | Hopper | |
---|---|---|
Precisões do Núcleo Tensor suportadas | FP64, TF32, BF16, FP16, FP8, INT8, FP6, FP4 | FP64, TF32, BF16, FP16, FP8, INT8 |
Precisões do Núcleo CUDA® suportadas | FP64, FP32, FP16, BF16 | FP64, FP32, FP16, BF16, INT8 |
*Especificações preliminares, podem estar sujeitas a alterações
Interessado no NVIDIA Blackwell?