提供人工智慧、資料分析與高效 能運算應用程式安全 多租戶的裸機效能。
雲端原生超級運算結合高效能運算的力量及雲端運算服務的安全性與易用性。NVIDIA 雲端原生超級運算平台運用 NVIDIA® BlueField® 資料處理器 (DPU) 架構和高速且低延遲的 NVIDIA Quantum InfiniBand 網路,以簡單且安全的方式提供裸機效能、使用者管理和隔離、資料保護、隨選高效能運算 (HPC)和人工智慧服務。
為提供最高效能,超級電腦需提供多租用戶安全性,透過雲端原生平台達成此目標則是再理想不過。DPU 是完成此架構轉移的關鍵元素。
作為全面整合的資料中心單晶片平台,DPU 可以卸載和管理資料中心基礎架構,而並非主機處理器,這有助於確保超級電腦的安全性和協調流程。
結合 NVIDIA Quantum InfiniBand 交換器,此架構提供最佳裸機效能,同時原生支援多節點租用戶隔離功能。
雲端原生超級運算系統專為在多租用戶環境提供最高的效能、安全性和協調流程而設計。
BlueField DPU 可以託管未受信任的多節點租用戶,同時確保將清理過的超級運算資源交給新租用戶,沒有先前的殘差。為了達成此目標,BlueField DPU 為新安排的租用戶提供乾淨開機影像、執行完整清理、重新建立信任、虛擬化儲存空間,以及授予核准儲存空間區域的存取權限。
高效能運算與人工智慧通訊框架和函式庫注重頻寬和延遲度,在決定應用程式效能中扮演關鍵角色。
將函式庫從主機 CPU 或 GPU 卸載至 Bluefield DPU,為通訊和運算的平行進展創造高度重疊。此技術減少作業系統不穩定所帶來的負面影響,並大幅提升應用程式效能。這是啟用新一代超級運算架構的關鍵。
俄亥俄州立大學的早期研究成果顯示,雲端原生超級運算執行高效能運算工作的速度比傳統方式快 1.3 倍。
1效能測試由高效能運算人工智慧諮詢委員會的叢集中心進行,系統設定如下:32 部伺服器,使用雙插槽 Intel Xeon 16 核心 CPU E5-2697A V4 @ 2.60GHz (每個節點共有 32 個處理器)、256GB DDR4 2400MHz RDIMM 記憶體,每個節點使用 1TB 7.2K RPM SATA 2.5 吋硬碟。伺服器使用 NVIDIA BlueField-2 InfiniBand HDR100 DPUS 和 NVIDIA Quantum QM7800 40 埠 HDR 每秒 200GB InfiniBand 交換器連接。
NVIDIA Quantum-2 InfiniBand 平台提供創新的主動監控和壅塞管理,以提供流量隔離,幾乎能排除所有效能不穩定的現象,還可確保預期效能有如應用程式在專用系統上執行一般。
NVIDIA BlueField DPU NVIDIA BlueField DPU 結合領先業界的 NVIDIA ConnectX® 網路介面卡、採用 Arm 核心的 PCIe 子系統,以及專為提供完整單晶片資料中心基礎架構可程式性而打造的高效能運算硬體加速引擎。
NVIDIA Quantum InfiniBand 網路可加速並卸載資料傳輸,確保運算資源時不會因資料或頻寬不足而煩惱。InfiniBand 網路可在不同使用者或租用戶間分割,提供安全性和服務品質保障。
NVIDIA 單晶片資料中心基礎架構 SDK 讓基礎架構開發人員能夠運用業界標準 API,在 NVIDIA BlueField DPU 上快速建立網路、儲存空間、安全性、管理及人工智慧與高效能運算應用程式和服務。有了單晶片資料中心基礎架構,開發人員可以建立高效能、軟體定義和雲端原生 DPU 加速的服務,編程未來的超級運算基礎架構。
NVIDIA MAGNUM IO™ 軟體開發套件讓開發人員能將應用程式的輸入/輸出 (IO) 最佳化,減少工作流程的端對端時間。
Magnum IO 涵蓋輸入/輸出的所有層面,包括儲存空間、網路、多 GPU 和多節點通訊。同時也包含分析、微調應用程式及消除輸入/輸出瓶頸的工具。