Arquitetura NVIDIA Blackwell

O motor da nova revolução industrial, agora em plena produção.

Introdução
Avanços Tecnológicos
GB200 NVL72
Resumo Técnico

Introdução
Avanços Tecnológicos
GB200 NVL72
Resumo Técnico

Quebrando Barreiras em IA Generativa e Computação Acelerada

Explore os avanços inovadores que a arquitetura NVIDIA Blackwell traz para IA generativa e computação acelerada. Baseando-se em gerações de tecnologias NVIDIA, a Blackwell define o próximo capítulo em IA generativa com desempenho, eficiência e escala incomparáveis.

Veja por Dentro dos Avanços Tecnológicos

Uma Nova Classe de Superchip de IA

As GPUs da arquitetura Blackwell contêm 208 bilhões de transistores e são fabricadas usando um processo TSMC 4NP personalizado. Todos os produtos Blackwell apresentam duas matrizes limitadas por retículo conectadas por uma interconexão chip a chip de 10 terabytes por segundo (TB/s) em uma única GPU unificada..

Transformer Engine de Segunda Geração

O Transformer Engine de segunda geração usa a tecnologia personalizada Blackwell Tensor Core combinada com as inovações NVIDIA® TensorRT™-LLM e Framework NeMo™ para acelerar a inferência e o treinamento para grandes modelos de linguagem (LLMs) e modelos de mistura de especialistas (MoE).

Para turbinar a inferência de modelos MoE, os Blackwell Tensor Cores adicionam novas precisões, incluindo novos formatos de microescala definidos pela comunidade, proporcionando alta precisão e facilidade de substituição para precisões maiores. O Transformer Engine do Blackwell utiliza técnicas de escalonamento de granulação fina chamadas escalonamento de microtensor, para otimizar o desempenho e a precisão, permitindo IA de ponto flutuante de 4 bits (FP4). Isso duplica o desempenho e o tamanho dos modelos de próxima geração que a memória pode suportar, mantendo, ao mesmo tempo, alta precisão.

IA Segura

A Blackwell inclui a Computação Confidencial da NVIDIA, que protege dados confidenciais e modelos de IA contra acesso não autorizado com forte segurança baseada em hardware. A Blackwell é a primeira GPU compatível com TEE-I/O do setor, ao mesmo tempo que fornece a solução de computação confidencial de melhor desempenho com hosts compatíveis com TEE-I/O e proteção em linha sobre NVIDIA® NVLink®. A Computação Confidencial da Blackwell oferece desempenho de rendimento quase idêntico em comparação com modos não criptografados. As empresas agora podem proteger até mesmo os maiores modelos com alto desempenho, além de proteger a propriedade intelectual (IP) da IA e permitir com segurança treinamento confidencial de IA, inferência e aprendizagem federada

Saiba Mais Sobre a Computação Confidencial da NVIDIA

NVLink e Switch NVLink

Desbloquear todo o potencial da computação em exaescala e dos modelos de IA de trilhões de parâmetros depende da necessidade de comunicação rápida e contínua entre cada GPU em um cluster de servidores. A quinta geração do NVIDIA® NVLink® é uma interconexão escalável que proporciona desempenho acelerado para modelos de IA de trilhões e multitrilhões de parâmetros.

A quarta geração do NVIDIA NVSwitch™ permite 130TB/s de largura de banda de GPU em um domínio NVLink de 72 GPU (NVL72) e oferece 4 vezes mais eficiência de largura de banda com suporte ao NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ FP8. Usando o NVSwitch , o sistema de switch NVIDIA NVLink oferece suporte a clusters além de um único servidor com a mesma interconexão impressionante de 1,8TB/s. Clusters de vários servidores com NVLink dimensionam as comunicações de GPU em equilíbrio com o aumento da computação, de modo que o NVL72 pode suportar 9 vezes o rendimento da GPU do que um único sistema de oito GPU.

Saiba Mais Sobre NVIDIA NVLink e o Switch NVLink

Mecanismo de Descompressão

A análise de dados e os workflows de banco de dados tradicionalmente dependem de CPUs para computação. A ciência de dados acelerada pode aumentar significativamente o desempenho da análise ponta a ponta, acelerando a geração de valor e reduzindo custos. Os bancos de dados, incluindo o Apache Spark, desempenham funções críticas no manuseio, processamento e análise de grandes volumes de dados para análise de dados.

O mecanismo de descompressão da Blackwell e a capacidade de acessar grandes quantidades de memória na CPU NVIDIA Grace™ através de um link de alta velocidade (900 gigabytes por segundo (GB/s) de largura de banda bidirecional) aceleram o pipeline completo de consultas de banco de dados para obter o mais alto desempenho em dados análise e ciência de dados, com suporte para os formatos de compactação mais recentes, como LZ4, Snappy e Deflate

Mecanismo de Confiabilidade, Disponibilidade e Capacidade de Manutenção (RAS)

A Blackwell adiciona resiliência inteligente com um mecanismo dedicado de confiabilidade, disponibilidade e capacidade de manutenção (RAS) para identificar falhas potenciais que podem ocorrer antecipadamente para minimizar o tempo de inatividade. Os recursos de gerenciamento preditivo baseados em IA da NVIDIA monitoram continuamente milhares de pontos de dados em hardware e software para verificar a integridade geral e prever e interceptar fontes de tempo de inatividade e ineficiência. Isso cria resiliência inteligente que economiza tempo, energia e custos de computação.

O mecanismo RAS da NVIDIA fornece informações de diagnóstico detalhadas que podem identificar áreas de preocupação e planejar manutenção. O mecanismo RAS reduz o tempo de resposta ao localizar rapidamente a origem dos problemas e minimiza o tempo de inatividade ao facilitar a correção eficaz.

Apresentando o NVIDIA Project DIGITS

O NVIDIA Project DIGITS traz o poder da Grace Blackwell para desktops de desenvolvedores. O GB10 Superchip, combinado com 128 GB de memória unificada do sistema, permite que pesquisadores de IA, cientistas de dados e estudantes trabalhem com modelos de IA localmente com até 200 bilhões de parâmetros.

Saiba Mais

Desbloqueie Modelos em Tempo Real com Trilhões de Parâmetros com a NVIDIA GB200 NVL72

A NVIDIA GB200 NVL72 conecta 36 Superchips GB200 Grace Blackwell com 36 CPUs Grace e 72 GPUs Blackwell em um design em escala de rack. A GB200 NVL72 é uma solução refrigerada a líquido com um domínio NVLink de 72 GPUs que atua como uma única GPU massiva, oferecendo inferência em tempo real 30 vezes mais rápida para grandes modelos de linguagem com trilhões de parâmetros.

Saiba Mais Sobre a NVIDIA GB200 NVL72

Blog Técnico NVIDIA NVFP4

Saiba como a nova quantização de 4 bits NVFP4 da NVIDIA para pré-treinamento possibilita grandes melhorias no treinamento de LLMs em escala e na eficiência geral da infraestrutura.

Leia Agora