NVIDIA GB200 NVL72

Impulsionando a nova era da IA generativa.

Introdução
Destaques
Características
Especificações

Introdução

Introdução
Destaques
Características
Especificações

Desbloqueando Modelos de Trilhões de Parâmetros em Tempo Real

O GB200 NVL72 conecta 36 CPUs Grace e 72 GPUs Blackwell em um design em escala de rack com resfriamento líquido. Ele possui um domínio NVLink de 72 GPUs que age como uma única grande GPU e oferece inferência de grande modelos de linguagem (LLM), com trilhões de parâmetros em tempo real, 30 vezes mais rápida.

O Superchip GB200 Grace Blackwell é um componente fundamental do NVIDIA GB200 NVL72, que conecta duas GPUs NVIDIA Blackwell Tensor Core de alto desempenho e uma CPU NVIDIA Grace™ usando a interconexão NVIDIA NVLink™-C2C às duas GPUs Blackwell.

A Arquitetura em Escala de Rack da Blackwell para Inferência e Treinamento de Trilhões de Parâmetros em Tempo Real

O NVIDIA GB200 NVL72 é um computador exascala em um único rack. Com 36 GB200s interconectados pelo maior domínio NVIDIA® NVLink® já oferecido, o Sistema de Switch NVLink fornece 130 terabytes por segundo (TB/s) de comunicações de GPU de baixa latência para cargas de trabalho de IA e computação de alto desempenho (HPC).

Blog Técnico

Destaques

Impulsionando a IA de Próxima Geração e a Computação Acelerada

Inferência LLM

30X vs. GPU Tensor Core NVIDIA H100

Treinamento LLM

4X versus H100

Eficiência Energética

25X versus H100

Processamento de Dados

18X versus CPU

Inferência LLM e eficiência energética: TTL = 50 milissegundos (ms) em tempo real, FTL = 5s, 32.000 entradas/1.000 saídas, NVIDIA HGX™ H100 escalonado sobre InfiniBand (IB) vs. GB200 NVL72, treinamento 1,8T MOE HGX H100 escalonado sobre IB vs. GB200 NVL72 dimensionado sobre IB. Tamanho do cluster: 30.000
Consulta TPC-H 4: GB200 vs. Intel Xeon 8480+
Desempenho projetado sujeito a alterações.

Inferência de LLM em Tempo Real

O GB200 NVL72 introduz recursos de ponta e um Transformer Engine de segunda geração, que permite a IA FP4. Quando acoplado com o NVIDIA NVLink de quinta geração, ele oferece desempenho de inferência de LLM em tempo real 30 vezes mais rápido para modelos de linguagem de trilhões de parâmetros. Esse avanço é possível com uma nova geração de Núcleos Tensores, que introduzem novos formatos de microescala, proporcionando alta precisão e maior rendimento. Além disso, o GB200 NVL72 usa NVLink e resfriamento líquido para criar um único rack enorme de 72 GPUs que pode superar os gargalos de comunicação.

Treinamento em Larga Escala

O GB200 NVL72 inclui um Transformer Engine de segunda geração mais rápido, com precisão FP8, permitindo um treinamento notável 4 vezes mais rápido para grandes modelos de linguagem em escala. Esse avanço é complementado pelo NVLink de quinta geração, que fornece 1,8 TB/s de interconexão de GPU para GPU, redes InfiniBand e o software NVIDIA Magnum IO™.

Gráfico de desempenho de infraestrutura eficiente em energia

Infraestrutura Eficiente no Consumo de Energia

Os racks GB200 NVL72 com resfriamento líquido reduzem a pegada de carbono e o consumo de energia de um data center. O resfriamento por líquido aumenta a densidade da computação, reduz a quantidade de espaço usado e facilita a comunicação de GPU de alta largura de banda e baixa latência com grandes arquiteturas de domínio NVLink. Em comparação com a infraestrutura NVIDIA H100, o GB200 oferece 25 vezes mais desempenho com a mesma potência, reduzindo o consumo de água.

Processamento de Dados

Os bancos de dados desempenham funções críticas no manuseio, processamento e análise de grandes volumes de dados para empresas. O GB200 aproveita o desempenho da memória de alta largura de banda, NVLink-C2C e mecanismos de descompressão dedicados na arquitetura NVIDIA Blackwell para acelerar as principais consultas ao banco de dados em 18 vezes em comparação com a CPU e fornecer um TCO 5 vezes melhor.

Características

Avanços Tecnológicos

Arquitetura Blackwell

A arquitetura NVIDIA Blackwell oferece avanços inovadores em computação acelerada, definindo a nova era da computação com desempenho, eficiência e escala incomparáveis.

Saiba Mais

CPU NVIDIA Grace

O Superchip NVIDIA Grace CPU é um processador inovador projetado para data centers modernos que executam aplicações de IA, nuvem e computação de alto desempenho (HPC). Ele fornece excelente desempenho e largura de banda de memória com o dobro da eficiência energética dos principais processadores de servidor atuais.

Saiba Mais

NVIDIA NVLink de Quinta Geração

Desbloquear todo o potencial da computação de exaescala e modelos de IA de trilhões de parâmetros requer comunicação rápida e perfeita entre todas as GPUs de um cluster de servidores. A quinta geração do NVLink é uma interconexão escalável que promove o desempenho acelerado para modelos de IA com trilhões e vários trilhões de parâmetros.

Saiba Mais Sobre NVLink e Switch NVLink

Rede NVIDIA

A rede do data center desempenha um papel crucial em promover os avanços e aumentar o desempenho de IA, servindo como a espinha dorsal para o treinamento de modelos de IA distribuídos e desempenho de IA Generativa. O NVIDIA Quantum-X800 InfiniBand, o NVIDIA Spectrum™-X800 Ethernet e as DPUs NVIDIA® BlueField®-3 permitem escalabilidade eficiente em centenas e milhares de GPUs Blackwell para o desempenho ideal das aplicações.

Aprenda Sobre Soluções de Rede Ponta a Ponta

NVIDIA GB300 NVL72

O NVIDIA GB300 NVL72 possui 40 vezes mais desempenho de inferência de IA do que as plataformas Hopper, 40 TB de memória rápida e integração de plataforma de rede com SuperNICs NVIDIA ConnectX®-8 usando Quantum-X800 InfiniBand ou Spectrum™-X Ethernet. O Blackwell Ultra proporciona um desempenho revolucionário nas workloads mais complexas, desde sistemas baseados em agentes e lógica até a geração de vídeo em tempo real 30 vezes mais rápida.

Saiba Mais

Especificações

Especificações GB200 NVL72

	GB200 NVL72	Superchip GB200 Grace Blackwell
Configuração	36 CPU Grace: GPUs 72 Blackwell	1 CPU Grace: 2 GPUs Blackwell
Núcleo Tensor FP4¹	1,440 PFLOPS	40 PFLOPS
Núcleo Tensor FP8/FP6¹	720 PFLOPS	20 PFLOPS
Núcleo Tensor INT8¹	720 POPS	20 POPS
FP16/BF16 Tensor Core¹	360 PFLOPS	10 PFLOPS
TF32 Tensor Core	180 PFLOPS	5 PFLOPS
FP32	5,760 TFLOPS	160 TFLOPS
FP64	2,880 TFLOPS	80 TFLOPS
Núcleo Tensor FP64	2,880 TFLOPS	80 TFLOPS
Memória de GPU \| Largura de Banda	Até 13.4 TB HBM3e \| 576 TB/s	Até 372 GB HBM3e \| 16 TB/s
Largura de Banda NVLink	130TB/s	3.6TB/s
Contagem de Núcleos de CPU	2,592 Arm® Neoverse V2 cores	72 Arm Neoverse V2 cores
Memória de CPU \| Largura de Banda	Até 17 TB LPDDR5X \| Até 18.4 TB/s	Até 480GB LPDDR5X \| Até 512 GB/s
1. Com escassez.

Começar

Mantenha-se Atualizado

Inscreva-se para saber quando o NVIDIA Blackwell estiver disponível.

Quero Ser Notificado