NVIDIA Grace Blackwell GB200

NVIDIA GB200 NVL72

Impulsionando a nova era da IA generativa.

Desbloqueando Modelos de Trilhões de Parâmetros em Tempo Real

O GB200 NVL72 conecta 36 CPUs Grace e 72 GPUs Blackwell em um design em escala de rack com resfriamento líquido. Ele possui um domínio NVLink de 72 GPUs que age como uma única grande GPU e oferece inferência de grande modelos de linguagem (LLM), com trilhões de parâmetros em tempo real, 30 vezes mais rápida.

O Superchip GB200 Grace Blackwell é um componente fundamental do NVIDIA GB200 NVL72, que conecta duas GPUs NVIDIA Blackwell Tensor Core de alto desempenho e uma CPU NVIDIA Grace™ usando a interconexão NVIDIA NVLink™-C2C às duas GPUs Blackwell.

A Arquitetura em Escala de Rack da Blackwell para Inferência e Treinamento de Trilhões de Parâmetros em Tempo Real

O NVIDIA GB200 NVL72 é um computador exascala em um único rack. Com 36 GB200s interconectados pelo maior domínio NVIDIA® NVLink® já oferecido, o Sistema de Switch NVLink fornece 130 terabytes por segundo (TB/s) de comunicações de GPU de baixa latência para cargas de trabalho de IA e computação de alto desempenho (HPC).

Destaques

Impulsionando a IA de Próxima Geração e a Computação Acelerada

Inferência LLM

30X

Treinamento LLM

4X

Eficiência Energética

25X

Processamento de Dados

18X

Inferência LLM e eficiência energética: TTL = 50 milissegundos (ms) em tempo real, FTL = 5s, 32.000 entradas/1.000 saídas, NVIDIA HGX™ H100 escalonado sobre InfiniBand (IB) vs. GB200 NVL72, treinamento 1,8T MOE HGX H100 escalonado sobre IB vs. GB200 NVL72 dimensionado sobre IB. Tamanho do cluster: 30.000
Consulta TPC-H 4: GB200 vs. Intel Xeon 8480+
Desempenho projetado sujeito a alterações.

Gráfico de desempenho de Inferência de LLM em Tempo Real

Inferência de LLM em Tempo Real

O GB200 NVL72 introduz recursos de ponta e um Transformer Engine de segunda geração, que permite a IA FP4. Quando acoplado com o NVIDIA NVLink de quinta geração, ele oferece desempenho de inferência de LLM em tempo real 30 vezes mais rápido para modelos de linguagem de trilhões de parâmetros. Esse avanço é possível com uma nova geração de Núcleos Tensores, que introduzem novos formatos de microescala, proporcionando alta precisão e maior rendimento. Além disso, o GB200 NVL72 usa NVLink e resfriamento líquido para criar um único rack enorme de 72 GPUs que pode superar os gargalos de comunicação.

Gráfico de desempenho de treinamento em larga escala

Treinamento em Larga Escala

O GB200 NVL72 inclui um Transformer Engine de segunda geração mais rápido, com precisão FP8, permitindo um treinamento notável 4 vezes mais rápido para grandes modelos de linguagem em escala. Esse avanço é complementado pelo NVLink de quinta geração, que fornece 1,8 TB/s de interconexão de GPU para GPU, redes InfiniBand e o software NVIDIA Magnum IO™.

Gráfico de desempenho de infraestrutura eficiente em energia

Infraestrutura Eficiente no Consumo de Energia

Os racks GB200 NVL72 com resfriamento líquido reduzem a pegada de carbono e o consumo de energia de um data center. O resfriamento por líquido aumenta a densidade da computação, reduz a quantidade de espaço usado e facilita a comunicação de GPU de alta largura de banda e baixa latência com grandes arquiteturas de domínio NVLink. Em comparação com a infraestrutura NVIDIA H100, o GB200 oferece 25 vezes mais desempenho com a mesma potência, reduzindo o consumo de água.

Gráfico de desempenho de processamento de dados

Processamento de Dados

Os bancos de dados desempenham funções críticas no manuseio, processamento e análise de grandes volumes de dados para empresas. O GB200 aproveita o desempenho da memória de alta largura de banda, NVLink-C2C e mecanismos de descompressão dedicados na arquitetura NVIDIA Blackwell para acelerar as principais consultas ao banco de dados em 18 vezes em comparação com a CPU e fornecer um TCO 5 vezes melhor.

Características

Avanços Tecnológicos

Blackwell Architecture AI Icon

Arquitetura Blackwell

A arquitetura NVIDIA Blackwell oferece avanços inovadores em computação acelerada, definindo a nova era da computação com desempenho, eficiência e escala incomparáveis.

Grace CPU Icon

CPU NVIDIA Grace

O Superchip NVIDIA Grace CPU é um processador inovador projetado para data centers modernos que executam aplicações de IA, nuvem e computação de alto desempenho (HPC). Ele fornece excelente desempenho e largura de banda de memória com o dobro da eficiência energética dos principais processadores de servidor atuais.

NVSwitch Icon

NVIDIA NVLink de Quinta Geração

Desbloquear todo o potencial da computação de exaescala e modelos de IA de trilhões de parâmetros requer comunicação rápida e perfeita entre todas as GPUs de um cluster de servidores. A quinta geração do NVLink é uma interconexão escalável que promove o desempenho acelerado para modelos de IA com trilhões e vários trilhões de parâmetros.

NVIDIA Networking DPU Icon

Rede NVIDIA

A rede do data center desempenha um papel crucial em promover os avanços e aumentar o desempenho de IA, servindo como a espinha dorsal para o treinamento de modelos de IA distribuídos e desempenho de IA Generativa.  O NVIDIA Quantum-X800 InfiniBand, o NVIDIA Spectrum™-X800 Ethernet e as DPUs NVIDIA® BlueField®-3 permitem escalabilidade eficiente em centenas e milhares de GPUs Blackwell para o desempenho ideal das aplicações.

NVIDIA GB300 NVL72

O NVIDIA GB300 NVL72 possui 40 vezes mais desempenho de inferência de IA do que as plataformas Hopper, 40 TB de memória rápida e integração de plataforma de rede com SuperNICs NVIDIA ConnectX®-8 usando Quantum-X800 InfiniBand ou Spectrum™-X Ethernet. O Blackwell Ultra proporciona um desempenho revolucionário nas workloads mais complexas, desde sistemas baseados em agentes e lógica até a geração de vídeo em tempo real 30 vezes mais rápida.

NVIDIA GB300 NVL72

Especificações

Especificações GB200 NVL72

  GB200 NVL72 Superchip GB200 Grace Blackwell
Configuração 36 CPU Grace: GPUs 72 Blackwell 1 CPU Grace: 2 GPUs Blackwell
Núcleo Tensor FP41 1,440 PFLOPS 40 PFLOPS
Núcleo Tensor FP8/FP61 720 PFLOPS 20 PFLOPS
Núcleo Tensor INT81 720 POPS 20 POPS
FP16/BF16 Tensor Core1 360 PFLOPS 10 PFLOPS
TF32 Tensor Core 180 PFLOPS 5 PFLOPS
FP32 5,760 TFLOPS 160 TFLOPS
FP64 2,880 TFLOPS 80 TFLOPS
Núcleo Tensor FP64 2,880 TFLOPS 80 TFLOPS
Memória de GPU | Largura de Banda Até 13.4 TB HBM3e | 576 TB/s Até 372 GB HBM3e | 16 TB/s
Largura de Banda NVLink 130TB/s 3.6TB/s
Contagem de Núcleos de CPU 2,592 Arm® Neoverse V2 cores 72 Arm Neoverse V2 cores
Memória de CPU | Largura de Banda Até 17 TB LPDDR5X | Até 18.4 TB/s Até 480GB LPDDR5X | Até 512 GB/s

Começar

Mantenha-se Atualizado

Inscreva-se para saber quando o NVIDIA Blackwell estiver disponível.

Select Location
Middle East