Multi-Instance GPU (MIG) aumenta le prestazioni e il valore delle GPU NVIDIA Blackwell e Hopper™. La tecnologia MIG è in grado di partizionare la GPU in un numero massimo di sette istanze, ciascuna completamente isolata con la memoria a banda elevata, cache e core di elaborazione distinti. Gli amministratori possono ora supportare qualsiasi carico di lavoro, dal più piccolo al più grande, qualità del servizio (QoS) garantita per ogni processo estendendo la portata delle risorse di elaborazione accelerate a tutti gli utenti.
Senza MIG, l'esecuzione di più processi sulla stessa GPU, come diverse richieste di inferenza IA, competono per l'uso delle stesse risorse. Un processo che consuma molta banda di memoria lascia carenza di banda per gli altri, determinando problemi di latenza per diversi processi. Con MIG, i processi vengono eseguiti simultaneamente su diverse istanza, ognuna con risorse dedicate per elaborazione, memoria e banda, generando prestazioni prevedibili con QoS e utilizzo massimo della GPU.
L'architettura Hopper migliora ulteriormente MIG supportando configurazioni multi-tenant e multiutente in ambienti virtualizzati su un massimo di sette istanze GPU, isolando in modo sicuro ciascuna istanza con computing riservato a livello di hardware e hypervisor. I decoder video dedicati per ogni istanza MIG offrono analisi video intelligenti sicure e ad alta produttività (IVA) su infrastruttura condivisa. Con la profilazione MIG simultanea di Hopper, gli amministratori possono monitorare che l'accelerazione con GPU sia correttamente dimensionata e allocare le risorse a più utenti.
Per i ricercatori con carichi di lavoro più piccoli, invece di noleggiare un'istanza cloud completa, è possibile utilizzare MIG per isolare in modo sicuro una parte della GPU, garantendo al contempo che i dati siano al sicuro a riposo, in transito e in uso. Questa maggiore flessibilità permette ai fornitori di servizi cloud di stabilire i prezzi e gestire le opportunità per i clienti più piccoli.
MIG consente il provisioning granulare della GPU ai team IT e DevOps. Ogni istanza MIG si comporta come una GPU standalone per le applicazioni, quindi non c'è alcuna modifica alla piattaforma CUDA®. MIG può essere utilizzata in tutti i principali ambienti di calcolo aziendali.
GPU Blackwell Ultra | GPU Blackwell* | GPU H100 | |
---|---|---|---|
Confidential Computing | Sì | Sì | Sì |
Tipi di istanze | Fino a 7 x 34 GB Fino a 4 x 70 GB Fino a 2 x 140 GB Fino a 1 x 288 GB |
Fino a 7 x 23 GB Fino a 4 x 45 GB Fino a 2 x 95 GB Fino a 1 x 192 GB |
7x 10 GB 4x 20 GB 2x 40 GB 1x 80 GB |
Profilazione e monitoraggio delle GPU | Simultanei su tutte le istanze | Simultanei su tutte le istanze | CSimultanei su tutte le istanze |
Tenant sicuri | 7x | 7x | 7x |
Decoder multimediali | NVJPEG dedicato e NVDEC per istanza | NVJPEG dedicato e NVDEC per istanza | NVJPEG dedicato e NVDEC per istanza |
*Specifiche preliminari, soggette a modifica. *Dimensioni mostrate per le GPU Blackwell su GB200 NVL72. Le dimensioni MIG per le GPU Blackwell su HGX B200 sono inferiori, consulta ladocumentazione tecnica.
Scopri di più sulla tecnologia MIG.