A GPU multi-instância (MIG) expande o desempenho e o valor das GPUs da geração NVIDIA Blackwell e Hopper™. O MIG pode particionar a GPU em até sete instâncias, cada uma totalmente isolada com sua própria memória de alta largura de banda, cache e núcleos de computação. Isso dá aos administradores a capacidade de suportar todas as cargas de trabalho, da menor à maior, com qualidade de serviço (QoS) garantida e estendendo o alcance dos recursos de computação acelerados a todos os usuários.
Sem a MIG, tarefas diferentes executadas na mesma GPU, como solicitações de inferência de AI, competem pelos mesmos recursos. Um trabalho que consome uma largura de banda de memória maior prejudica os outros, e várias tarefas podem ficar sem atingir os objetivos de latência. Com a MIG, os trabalhos são executados simultaneamente em diferentes instâncias, cada uma com recursos dedicados para computação, memória e largura de banda de memória, resultando em desempenho previsível com qualidade de serviço (QoS) e aproveitamento máximo da GPU.
As GPUs Blackwell e Hopper suportam MIG com configurações multilocatários e multiusuários em ambientes virtualizados em até sete instâncias de GPU, isolando com segurança cada instância com computação confidencial no nível de hardware e hipervisor. Decodificadores de vídeo dedicados para cada instância MIG oferecem análise de vídeo inteligente (IVA) segura e de alto rendimento em infraestrutura compartilhada. Com o perfil MIG simultâneo, os administradores podem monitorar a aceleração da GPU no tamanho certo e alocar recursos para vários usuários.
Para pesquisadores com cargas de trabalho menores, em vez de alugar uma instância de nuvem completa, eles podem usar o MIG para isolar uma parte de uma GPU com segurança, garantindo ao mesmo tempo que seus dados estão seguros em repouso, em trânsito e em uso. Isso melhora a flexibilidade para que os provedores de serviços em nuvem precifiquem e abordem oportunidades menores de clientes.
A MIG permite o provisionamento detalhado de GPU pelas equipes de IT e DevOps. Cada instância de MIG se comporta como uma GPU autônoma para aplicações, então não há nenhuma alteração na plataforma CUDA®. A MIG pode ser usada nos principais ambientes de computação empresarial.
GB200/B200/B100 | H100 | H200 | |
---|---|---|---|
Computação Confidencial | Sim | Sim | Sim |
Tipos de Instância | Up to 7x 23GB Up to 4x 45GB Up to 2x 95GB Up to 1x 192GB |
7x 10GB 4x 20GB 2x 40GB 1x 80GB |
Up to 7x 18GB Up to 4x 35GB Up to 2x 71GB Up to 1x 141GB |
Perfil e Monitoramento de GPU | Simultaneamente em todas as instâncias | Simultaneamente em todas as instâncias | Simultaneamente em todas as instâncias |
Inquilinos Seguros | 7x | 7x | 7x |
Decodificadores de Mídia | NVJPEG e NVDEC dedicados por instância | NVJPEG e NVDEC dedicados por instância | NVJPEG e NVDEC dedicados por instância |
Especificações preliminares, podem estar sujeitas a alterações
Saiba Mais Sobre a NVIDIA Blackwell.