マルチインスタンス GPU (MIG) は、NVIDIA Blackwell および Hopper™ 世代 GPU のパフォーマンスと価値を拡張します。MIG は GPU を最大 7 つのインスタンスに分割でき、各インスタンスは独自の高帯域幅メモリ、キャッシュ、計算コアを備え完全に分離されています。これにより管理者は、サービス品質 (QoS) が保証された状態で最小から最大までのあらゆるワークロードに対応でき、アクセラレーテッド コンピューティング リソースをすべてのユーザーに提供できます。
MIG を使用しない場合、同じ GPU で実行されている複数のジョブ (各種の AI 推論リクエストなど) が、同一のリソースをめぐって競合することになります。メモリ帯域幅を多く消費するジョブがあると、他のジョブに十分な帯域幅を割り当てられなくなり、目標とするレイテンシを達成できないジョブがいくつか発生してしまいます。MIG を使用すれば、複数のインスタンスでジョブが同時に実行され、それぞれに専用のコンピューティング リソース、メモリ、メモリ帯域幅が割り当てられるため、パフォーマンスが予測可能になり、QoS が確保され、GPU が最大限まで活用されます。
Blackwell および Hopper GPU は、仮想化環境での最大 7 つの GPU インスタンスにわたるマルチテナント、マルチユーザー構成で MIG をサポートし、ハードウェアとハイパーバイザーレベルでの機密コンピューティングにより各インスタンスを安全に分離します。各 MIG インスタンス専用のビデオデコーダーにより、共有インフラストラクチャ上で安全かつ高スループットのインテリジェント ビデオ アナリティクス (IVA) を実現します。同時 MIG プロファイリングにより、管理者は適切なサイズの GPU アクセラレーションを監視し、複数ユーザーにリソースを割り当てることができます。
小規模なワークロードを持つ研究者は、完全なクラウド インスタンスをレンタルする代わりに、MIG を使用して GPU の一部を安全に分離しながら、保存中、転送中、使用中のデータが安全であることを確信できます。これにより、クラウド サービス プロバイダーの柔軟性が向上し、より小規模な顧客ニーズにも対応した価格設定が可能になります。
MIG では、IT と DevOps のチームが GPU を細かくプロビジョニングできます。各 MIG インスタンスは、アプリケーションに対してスタンドアロン GPU のように振る舞います。そのため、CUDA® プラットフォームに変更はありません。MIG は、すべての主要なエンタープライズ コンピューティング環境で使用できます。
Blackwell Ultra GPU | Blackwell GPU* | H100 GPU | |
---|---|---|---|
コンフィデンシャル コンピューティング | 対応 | 対応 | 対応 |
インスタンス タイプ | 最大 34GB x7 最大 70GB x4 最大 140GB x2 最大 288GB x1 |
最大 23GB x7 最大 45GB x4 最大 95GB x2 最大 192GB x1 |
10GB x7 20GB x4 40GB x2 80GB x1 |
GPU プロファイリングおよびモニタリング | すべてのインスタンスで同時実行可能 | すべてのインスタンスで同時実行可能 | すべてのインスタンスで同時実行可能 |
テナントの保護 | 7x | 7x | 7x |
メディア デコーダー | インスタンスごとに専用の NVJPEG および NVDEC を搭載 | インスタンスごとに専用の NVJPEG および NVDEC を搭載 | インスタンスごとに専用の NVJPEG および NVDEC を搭載 |
仕様は暫定的なものであり、変更される可能性があります。 *掲載されているサイズは GB200 NVL72 の Blackwell GPU に関するものです。HGX B200 の Blackwell GPU の MIG サイズはより小さくなります、詳細は技術文書をご参照ください。
MIG の詳細を見る.