新しい 400Gbps InfiniBand スイッチとネットワーク プラットフォームが、AI、データ分析、HPC アプリケーション向けに安全で、クラウドネイティブかつマルチテナントで、ベアメタル並み性能を提供
2021 年 11 月 9 日、カリフォルニア州サンタクララ — GTC — NVIDIA は本日、クラウドコンピューティング プロバイダーとスーパーコンピューティング センターが必要とする、圧倒的な性能、広範な利用性および強固なセキュリティを備えた、次世代の InfiniBand ネットワーク プラットフォームである、NVIDIA Quantum-2 を発表しました。
これまでで最も先進的な、エンドツーエンドのネットワーク プラットフォームである NVIDIA Quantum-2 は400Gbps InfiniBand ネットワーク プラットフォームで、NVIDIA Quantum-2 スイッチ、ConnectX-7® ネットワーク アダプター、BlueField-3® データ プロセッシング ユニット (DPU)、ならびにこの新しいアーキテクチャに対応するすべてのソフトウェアで構成されています。
NVIDIA Quantum-2の導入により、スーパーコンピューティング センターは、受け入れられるユーザー数が大幅に増加し、数多くの組織外のユーザーもこれを利用できるようになります。同時に世界では、スーパーコンピューティング サービスを数百万人の顧客に提供し始めている、クラウドサービス プロバイダーが増えています。
NVIDIA Quantum-2 には、スーパーコンピューティング センターとクラウド スーパーコンピューティングのいずれでも実行される、要件の厳しいワークロードを処理するための重要な機能が実装されています。クラウドネイティブのテクノロジを活用しているNVIDIA Quantum-2 は、400Gbpsのスループットという高い性能と、多くのユーザーに対処するための、先進的なマルチテナント機能を提供しています。
NVIDIA の ネットワーキング担当シニア バイスプレジデントのギラッド シャイナー (Gilad Shainer) は、次のように述べています。「現在のスーパーコンピューティング センターとパブリック クラウドの要件は収束しつつあります。これらは、次世代の HPC、AI およびデータ分析での課題に対して最高の性能を提供し、さらにワークロードを安全に分離して、ユーザー トラフィックのさまざまな要件に応える必要があります。現代のデータセンターに対するこのビジョンが、NVIDIA Quantum-2 InfiniBand によって現実のものとなります」
NVIDIA Quantum-2 の性能とクラウドネイティブ機能
400Gbps のスループットを実現する NVIDIA Quantum-2 InfiniBand により、ネットワークの速度が 2 倍に、ネットワーク ポートの数が 3 倍に増えます。また、性能は 3 倍になり、データセンターのファブリック スイッチの数が 6 分の 1 になるほか、データセンターの電力消費やデータセンターのスペースのいずれも 7% 削減します。
NVIDIA Quantum-2 のマルチテナント性能隔離により、1 つのテナントの活動が他のテナントに影響を与えないようにし、先進のテレメトリを活用した輻輳制御システムには、ユーザーまたはワークロードによる需要が急増しても、信頼性の高いスループットを保証する、クラウドネイティブの機能が備わっています。
NVIDIA Quantum-2 SHARPv3™ In-Network Computing テクノロジにより、AI アプリケーション向けのアクセラレーション エンジンの数がこれまでの世代の 32 倍に増えます。予知保全を含む、データセンター向けの高度な InfiniBand ファブリック管理は、NVIDIA UFM® Cyber-AI プラットフォームを通じて行われます。
NVIDIA Quantum-2 にはナノ秒の精度を持つタイミング システムが組み込まれているため、データベース処理のような分散アプリケーションとの同期が可能になり、待ち時間やアイドルタイムのオーバーヘッドが削減されます。ナノ秒単位のタイミングは新しい機能で、これにより、クラウド データセンターを通信ネットワークのなかに組み込むことができ、ソフトウェアデファインドの 5G 無線サービスをホストできるようになります。
Quantum-2 InfiniBand スイッチ
Quantum-2 の中心となるのは、新しい Quantum-2 InfiniBand スイッチです。7 ナノメーターのシリコンに 570 億個のトランジストタが搭載されおり、このスイッチは、540 億個のトランジストタが搭載されている NVIDIA A100 GPU よりもわずかに大きいです。
ポートの数は 400Gbps で 64ポート、200Gbps で 128ポート となっており、さまざまなスイッチ システムで最大 2,048 のポートが実装可能で、これは前の世代の Quantum-1 のスイッチング容量の 5 倍以上となっています。
さまざまなネットワークの速度、スイッチング容量および拡張性を組み合わせられることは、次世代の巨大な HPC システムの構築に最適です。
NVIDIA Quantum-2 スイッチは、Atos、DataDirect Networks (DDN)、Dell Technologies、Excelero、GIGABYTE、HPE、IBM、Inspur Electronic Information、Lenovo、Penguin Computing、QCT、Supermicro、VAST Data および WekaIO を含む、世界中のさまざまな大手インフラストラクチャ ベンダーおよびシステム ベンダーより入手いただけます。
Quantum-2 ConnectX-7 と BlueField-3
NVIDIA Quantum-2 プラットフォームには、NVIDIA ConnectX-7 NIC と NVIDIA BlueField-3 DPU InfiniBand という、2 つのネットワーク エンドポイントのオプションが用意されています。
7 ナノメーターの設計に 80 億個のトランジスタを搭載した ConnectX-7 は、そのデータレートは現在世界トップクラスの HPC ネットワーク チップである、NVIDIA ConnectX-6 の 2 倍となっています。さらに、RDMA、GPUDirect® Storage、GPUDirect RDMA および In-Networking Computing の性能も 2 倍になります。ConnectX-7 は、1月にサンプル出荷予定です。
7 ナノメーターの設計に 220 億個のトランジスタを搭載した BlueField-3 InfiniBand には、データセンター インフラストラクチャ スタックをオフロードおよび隔離する、64 ビットの Arm CPU が 16 基搭載されています。BlueField-3 は、5 月にサンプル出荷予定です。
NVIDIA について
NVIDIA (NASDAQ: NVDA) による GPU の発明は、PC ゲーミング市場の成長に爆発的な拍車をかけ、現代のコンピューター グラフィックス、ハイパフォーマンス コンピューティング、そして人工知能 (AI) を再定義しました。NVIDIA のアクセラレーテッド コンピューティングと AI における先駆的な取り組みは、輸送、ヘルスケア、製造業などの数兆ドル規模の産業を再構築し、その他のさまざまな産業の拡大も加速させています。詳細は、こちらのリンクから:https://nvidianews.nvidia.com/