A GPU multi-instância (MIG) expande o desempenho e o valor das GPUs da geração NVIDIA Blackwell e Hopper™. O MIG pode particionar a GPU em até sete instâncias, cada uma totalmente isolada com sua própria memória de alta largura de banda, cache e núcleos de computação. Isso dá aos administradores a capacidade de suportar todas as cargas de trabalho, da menor à maior, com qualidade de serviço (QoS) garantida e estendendo o alcance dos recursos de computação acelerados a todos os usuários.
Sem a MIG, tarefas diferentes executadas na mesma GPU, como solicitações de inferência de AI, competem pelos mesmos recursos. Um trabalho que consome uma largura de banda de memória maior prejudica os outros, e várias tarefas podem ficar sem atingir os objetivos de latência. Com a MIG, os trabalhos são executados simultaneamente em diferentes instâncias, cada uma com recursos dedicados para computação, memória e largura de banda de memória, resultando em desempenho previsível com qualidade de serviço (QoS) e aproveitamento máximo da GPU.
As GPUs Blackwell e Hopper suportam MIG com configurações multilocatários e multiusuários em ambientes virtualizados em até sete instâncias de GPU, isolando com segurança cada instância com computação confidencial no nível de hardware e hipervisor. Decodificadores de vídeo dedicados para cada instância MIG oferecem análise de vídeo inteligente (IVA) segura e de alto rendimento em infraestrutura compartilhada. Com o perfil MIG simultâneo, os administradores podem monitorar a aceleração da GPU no tamanho certo e alocar recursos para vários usuários.
Para pesquisadores com cargas de trabalho menores, em vez de alugar uma instância de nuvem completa, eles podem usar o MIG para isolar uma parte de uma GPU com segurança, garantindo ao mesmo tempo que seus dados estão seguros em repouso, em trânsito e em uso. Isso melhora a flexibilidade para que os provedores de serviços em nuvem precifiquem e abordem oportunidades menores de clientes.
A MIG permite o provisionamento detalhado de GPU pelas equipes de IT e DevOps. Cada instância de MIG se comporta como uma GPU autônoma para aplicações, então não há nenhuma alteração na plataforma CUDA®. A MIG pode ser usada nos principais ambientes de computação empresarial.
Blackwell Ultra GPU | Blackwell GPU* | GPU H100 | |
---|---|---|---|
Computação Confidencial | Sim | Sim | Sim |
Tipos de Instância | Até 7 de 34GB Até 4 de 70GB Até 2 de 140GB Até 1 de 288GB |
Até 7 de 23GB Até 4 de 45GB Até 2 de 95GB Até 1 de 192GB |
7 de 10GB 4 de 20GB 2 de 40GB 1 de 80GB |
Criação e Monitoramento de Perfis de GPU | Simultaneamente em todas as instâncias | Simultaneamente em todas as instâncias | Simultaneamente em todas as instâncias |
Locatários Seguros | 7 | 7 | 7 |
Decodificadores de Mídia | DNVJPEG e NVDEC dedicados por instância | NVJPEG e NVDEC dedicados por instância | NVJPEG e NVDEC dedicados por instância |
Especificações preliminares, podem estar sujeitas a alterações. *Tamanhos mostrados para GPUs Blackwell em GB200 NVL72. Os tamanhos da MIG para GPUs Blackwell no HGX B200 são menores; consulte a documentação técnica.
Saiba Mais Sobre MIG.