La GPU de instancias múltiples (MIG) amplía el rendimiento y el valor de las GPU de generación NVIDIA Blackwell y Hopper™. MIG puede dividir la GPU en hasta siete instancias, cada una completamente aislada con su propia memoria de gran ancho de banda, caché y núcleos de computación. Esto brinda a los administradores la capacidad de soportar cada carga de trabajo, desde la más pequeña hasta la más grande, con calidad de servicio (QoS) garantizada y ampliando el alcance de los recursos de computación acelerados a cada usuario.
Sin MIG, los diferentes trabajos que se ejecutan en la misma GPU, como diferentes solicitudes de inferencia de IA, compiten por los mismos recursos. Un trabajo que consume un ancho de banda de memoria más grande impide que los otros trabajos se completen, lo que hace que no puedan cumplir con sus objetivos de latencia. Con MIG, los trabajos se ejecutan simultáneamente en diferentes instancias, cada una con recursos dedicados para la computación, la memoria y el ancho de banda de memoria, lo que da como resultado un rendimiento predecible con QoS y la máxima utilización de la GPU.
Las GPU Blackwell y Hopper admiten MIG con configuraciones multiinquilino y multiusuario en entornos virtualizados en hasta siete instancias de GPU, aislando de forma segura cada instancia con computación confidencial a nivel de hardware e hipervisor. Los decodificadores de video dedicados para cada instancia MIG brindan análisis de video inteligente (IVA) seguros y de alto rendimiento en infraestructura compartida. Con perfiles MIG simultáneos, los administradores pueden monitorear la aceleración de GPU del tamaño adecuado y asignar recursos para múltiples usuarios.
Para los investigadores con cargas de trabajo más pequeñas, en lugar de alquilar una instancia completa en la nube, pueden usar MIG para aislar una parte de una GPU de forma segura y, al mismo tiempo, tener la seguridad de que sus datos están seguros en reposo, en tránsito y en uso. Esto mejora la flexibilidad para que los proveedores de servicios en la nube fijen precios y aborden oportunidades para clientes más pequeños.
MIG permite el aprovisionamiento detallado de la GPU por parte de los equipos de TI y DevOps. Cada instancia de MIG se comporta como una GPU independiente para las aplicaciones, por lo que no hay cambio en la plataforma CUDA®. MIG se puede usar en los principales entornos de computación empresarial.
GPU Blackwell Ultra | GPU Blackwell* | GPU H100 | |
---|---|---|---|
Computación Confidencial | Sí | Sí | Sí |
Tipos de Instancias | Hasta 7 de 34GB Hasta 4 de 70GB Hasta 2 de 140GB Hasta 1 de 288GB |
Hasta 7 de 23GB Hasta 4 de 45GB Hasta 2 de 95GB Hasta 1 de 192GB |
7 de 10GB 4 de 20GB 2 de 40GB 1 de 80GB |
Generación de Perfiles y Monitoreo de GPU | Al mismo tiempo en todas las instancias | Al mismo tiempo en todas las instancias | Al mismo tiempo en todas las instancias |
Clientes Seguros | 7 | 7 | 7 |
Decodificadores de Medios | NVJPEG y NVDEC dedicados por instancia | NVJPEG y NVDEC dedicados por instancia | NVJPEG y NVDEC dedicados por instancia |
Las especificaciones preliminares pueden cambiar.. *Tamaños mostrados para las GPU Blackwell en GB200 NVL72. Los tamaños de MIG para las GPU Blackwell en HGX B200 son menores, consulte la documentación técnica.
Más Información sobre MIG.