La GPU multiinstancia (MIG) aumenta el rendimiento y el valor de NVIDIA Blackwell y Hopper™ GPU de generación. MIG puede dividir la GPU en hasta siete instancias totalmente aisladas con su propia memoria de ancho de banda alta, su caché y sus núcleos de procesamiento. Esto permite a los administradores admitir todas las cargas de trabajo, desde las más pequeñas hasta las más grandes, con calidad de servicio (QoS) garantizada y extendiendo el alcance de los recursos informáticos acelerados a cada usuario.
Sin MIG, los distintos trabajos que se ejecutan en la misma GPU, como diferentes solicitudes de inferencia de IA, compiten por los mismos recursos. Un trabajo que consume un ancho de banda de memoria más grande priva a otros de este, lo que provoca que varios trabajos pierdan sus objetivos de latencia. Con MIG, los trabajos se ejecutan simultáneamente en diferentes instancias, cada una con recursos dedicados para el uso de proceso, memoria y ancho de banda de memoria, lo que resulta en un rendimiento predecible con QoS y la máxima utilización de la GPU.
La arquitectura Hopper mejora aún más la MIG al admitir configuraciones multiinquilino y multiusuario en entornos virtualizados en hasta siete instancias de GPU, lo que permite aislar cada instancia de forma segura con informática confidencial en el nivel de hardware y de hipervisor. Los descodificadores de vídeo dedicados para cada instancia de MIG ofrecen un análisis inteligente de vídeo (IVA) seguro y de alto rendimiento en una infraestructura compartida. Gracias a la generación simultánea de perfiles de MIG, los administradores pueden supervisar la aceleración de GPU de un tamaño adecuado y optimizar la asignación de recursos para varios usuarios.
Por su parte, los investigadores con cargas de trabajo más pequeñas, en vez de tener que alquilar una instancia de nube entera, pueden utilizar MIG para aislar sin riesgo alguno una parte de una GPU mientras tienen la seguridad de que sus datos están protegidos en reposo, en tránsito y en uso. Esto mejora la flexibilidad para que los proveedores de servicios en la nube puedan establecer precios que capten a clientes más pequeños.
MIG permite a los equipos de TI y DevOps realizar un aprovisionamiento muy específico de GPU. Cada instancia de MIG se comporta como una GPU independiente para las aplicaciones, por lo que no hay ningún cambio en la plataforma CUDA®. MIG se puede utilizar en los principales entornos informáticos empresariales.
GPU Blackwell Ultra | GPU Blackwell* | GPU H100 | |
---|---|---|---|
Informática confidencial | Sí | Sí | Sí |
Tipos de instancias | Hasta 7 de 34 GB Hasta 4 de 70 GB Hasta 2 de 140 GB Hasta 1 de 288 GB |
Hasta 7 de 23 GB Hasta 4 de 45 GB Hasta 2 de 95 GB Hasta 1 de 192 GB |
7x 10 GB 4x 20 GB 2x 40 GB 1x 80 GB |
Generación de perfiles y supervisión de GPU | Simultáneamente en todos las instancias | Simultáneamente en todos las instancias | Simultáneamente en todos las instancias |
Inquilinos seguros | 7x | 7x | 7x |
Descodificadores de contenido | NVJPEG y NVDEC dedicados por instancia | NVJPEG y NVDEC dedicados por instancia | NVJPEG y NVDEC dedicados por instancia |
Las especificaciones preliminares pueden estar sujetas a cambios. *Tamaños mostrados para las GPU Blackwell en GB200 NVL72. Los tamaños de MIG para GPU Blackwell en HGX B200 son más bajos; consulte la documentación técnica .
Más información sobre MIG.