T4 引入革命性的 Turing Tensor 核心技術,搭配多精度運算功能,可處理多種類型的工作負載。讓 FP32、FP16 到 INT8 發揮突破性效能,及提供 INT4 精度的 T4,效能比 CPU 高 40 倍。
NVIDIA T4
彈性設計與突破性效能
我們正邁向一個所有客戶的互動與所有產品和服務都導入人工智慧並越來越進步的未來。實現這項未來願景需要能加速全種類現代人工智慧的運算平台,讓企業能夠重新設計客戶體驗,以及達成、甚至超越客戶期望的方式,並以符合成本效益的方式擴充採用人工智慧技術的產品和服務。
NVIDIA® T4 GPU 可加速多種類型的雲端工作負載,包含高效能運算、深度學習訓練與推論、機器學習、資料分析和繪圖運算。採用全新 NVIDIA Turing™ 架構與節能的 70 瓦小型 PCIe 封裝,T4 針對主流運算環境進行了優化,具有多精度 Turing Tensor 核心和新的 RT 核心。而 T4 與 NGC 上的加速容器化應用軟體堆疊結合,則可大規模提供革命性效能。
全新合作夥伴正在推動混和雲驅動現代企業工作負載。
T4 引入革命性的 Turing Tensor 核心技術,搭配多精度運算功能,可處理多種類型的工作負載。讓 FP32、FP16 到 INT8 發揮突破性效能,及提供 INT4 精度的 T4,效能比 CPU 高 40 倍。
對使用者而言,反應能力是他們決定是否參與對話式人工智慧、推薦系統和視覺搜尋的關鍵。隨著模型的精準度和複雜度加倍,現在需要更大幅度的運算能力才能提供正確的答案。T4 的處理能力提高了 40 倍,因此可以即時處理更多需求。
Resnet50
DeepSpeech2
GNMT
Chip-to-chip GPU-to-CPU speedups | 1 NVIDIA T4 GPU vs 1 Xeon Gold 6140 CPU
線上影片的數量持續呈指數增加,對於快速搜尋影片,並從中取得洞見之解決方案的需求也持續增長。T4 為人工智慧影片應用程式提供突破性的效能,以及專用的硬體轉碼引擎,與前幾代的 GPU 相比,解碼效能提升兩倍。T4 最多可以解碼 38 個 Full HD 影片串流,因此能輕鬆地將可擴充的深度學習技術整合至影片轉碼流程,提供創新的智慧影片服務。
Turing Tensor 核心
320
NVIDIA CUDA® 核心
2,560
單精度效能 (FP32)
8.1 TFLOPS
混合精度 (FP16/FP32)
65 FP16 TFLOPS
INT8 精度
130 INT8 TOPS
INT4 精度
260 INT4 TOPS
Gen3
x16 PCIe
容量
16 GB GDDR6
頻寬
320+ GB/s
70 watts
探索全球最先進的推論平台