La GPU de instancias múltiples (MIG) amplía el rendimiento y el valor de las GPU de generación NVIDIA Blackwell y Hopper™. MIG puede dividir la GPU en hasta siete instancias, cada una completamente aislada con su propia memoria de gran ancho de banda, caché y núcleos de computación. Esto brinda a los administradores la capacidad de soportar cada carga de trabajo, desde la más pequeña hasta la más grande, con calidad de servicio (QoS) garantizada y ampliando el alcance de los recursos de computación acelerados a cada usuario.
Sin MIG, los diferentes trabajos que se ejecutan en la misma GPU, como diferentes solicitudes de inferencia de IA, compiten por los mismos recursos. Un trabajo que consume un ancho de banda de memoria más grande impide que los otros trabajos se completen, lo que hace que no puedan cumplir con sus objetivos de latencia. Con MIG, los trabajos se ejecutan simultáneamente en diferentes instancias, cada una con recursos dedicados para la computación, la memoria y el ancho de banda de memoria, lo que da como resultado un rendimiento predecible con QoS y la máxima utilización de la GPU.
Las GPU Blackwell y Hopper admiten MIG con configuraciones multiinquilino y multiusuario en entornos virtualizados en hasta siete instancias de GPU, aislando de forma segura cada instancia con computación confidencial a nivel de hardware e hipervisor. Los decodificadores de video dedicados para cada instancia MIG brindan análisis de video inteligente (IVA) seguros y de alto rendimiento en infraestructura compartida. Con perfiles MIG simultáneos, los administradores pueden monitorear la aceleración de GPU del tamaño adecuado y asignar recursos para múltiples usuarios.
Para los investigadores con cargas de trabajo más pequeñas, en lugar de alquilar una instancia completa en la nube, pueden usar MIG para aislar una parte de una GPU de forma segura y, al mismo tiempo, tener la seguridad de que sus datos están seguros en reposo, en tránsito y en uso. Esto mejora la flexibilidad para que los proveedores de servicios en la nube fijen precios y aborden oportunidades para clientes más pequeños.
MIG permite el aprovisionamiento detallado de la GPU por parte de los equipos de TI y DevOps. Cada instancia de MIG se comporta como una GPU independiente para las aplicaciones, por lo que no hay cambio en la plataforma CUDA®. MIG se puede usar en los principales entornos de computación empresarial.
GB200/B200/B100 | H100 | H200 | |
---|---|---|---|
Computación Confidencial | Sí | Sí | Sí |
Tipos de Instancia | Up to 7x 23GB Up to 4x 45GB Up to 2x 95GB Up to 1x 192GB |
7x 10GB 4x 20GB 2x 40GB 1x 80GB |
Up to 7x 18GB Up to 4x 35GB Up to 2x 71GB Up to 1x 141GB |
Perfilado y Monitoreo de GPU | Simultáneamente en todas las instancias | Simultáneamente en todas las instancias | Simultáneamente en todas las instancias |
Inquilinos Seguros | 7x | 7x | 7x |
Decodificadores de Medios | NVJPEG y NVDEC dedicados por instancia | NVJPEG y NVDEC dedicados por instancia | NVJPEG y NVDEC dedicados por instancia |
Especificaciones preliminares, pueden estar sujetas a cambios.
Obtenga Más Información Sobre NVIDIA Blackwell.