加速超過 700 種高效能運算應用程式 (包含前 15 大高效能運算應用程式) 及所有深度學習框架,搭配 NVIDIA NVLink 的 Tesla P100 可提升高達 50 倍的效能。
NVIDIA Tesla P100
世界第一個人工智慧超級運算資料中心 GPU
現今的資料中心仰賴許多互連設備運算節點,使高效能運算 (HPC) 與超大規模工作負載受到限制。NVIDIA® Tesla® P100 採用 NVIDIA Pascal™ GPU 架構,提供整合平台來加速高效能運算和人工智慧,大幅提高輸送量並節省成本。
加速超過 700 種高效能運算應用程式 (包含前 15 大高效能運算應用程式) 及所有深度學習框架,搭配 NVIDIA NVLink 的 Tesla P100 可提升高達 50 倍的效能。
Tesla P100 從硬體到軟體均重新設計,在每個設計環節都加入創新元素。每項突破性技術都展現效能的大躍進,催生出全球最快速運算節點。
NVIDIA Pascal 架構讓 Tesla P100 得以為高效能運算和超大規模的工作負載提供卓越效能。Pascal 具有 每秒 21 兆次 以上的 16 位元浮點運算 (FP16) 效能,專為激發深度學習應用程式新潛能而最佳化。Pascal 也可為高效能運算工作負載提供每秒超過 5 和 10 兆次的雙精度和單精度浮點運算效能。
由於 Tesla P100 新增了 CoWoS 與 HBM2 技術,將同個封裝中的運算和資料緊密整合,記憶體效能因此比 NVIDIA Maxwell™ 架構高上 3 倍。讓包含大量資料的應用程式解決方案所需時間獲得跨世代的進步。
效能時常因為互連而受到限制,但革命性的 NVIDIA NVLink 高速雙向互連技術 卻比現今的同級最佳技術快上 5 倍,因此得以運用多個 GPU 擴充應用程式。
注意:PCIe 適用的 Tesla P100 目前不支援此技術。
頁面移轉引擎讓開發人員能更專注於調整運算效能,減少管理資料移動所花費的時間。應用程式現在可擴充到超越 GPU 的實體記憶體大小,幾乎沒有限制。
PCIe 伺服器專用的 P100 | NVLink 最佳化伺服器專用的 P100 | |
---|---|---|
雙精度效能 | 4.7 兆次浮點運算 | 5.3 兆次浮點運算 |
單精度效能 | 9.3 兆次浮點運算 | 10.6 兆次浮點運算 |
半精度效能 | 18.7 兆次浮點運算 | 21.2 兆次浮點運算 |
NVIDIA NVLink 互連頻寬 | - | 每秒 160 GB |
PCIe x16 互連頻寬 | 每秒 32 GB | 每秒 32 GB |
CoWoS HBM2 堆疊記憶體容量 | 16 GB 或 12 GB | 16 GB |
CoWoS HBM2 堆疊記憶體頻寬 | 每秒 732 GB 或 549 GB | 每秒 732 GB |
利用頁面移轉引擎強化可程式性 | ||
可提升可靠性的 ECC 保護 | ||
針對伺服器最佳化,以進行資料中心部署 |
世界上最快速的高效能運算與
深度學習專用 GPU 加速器。
透過 NVIDIA 合作夥伴網路 (NPN)
尋找 NVIDIA 加速運算合作夥伴。