企業適用的機器學習作業解決方案

Weights & Biases

Weights & Biases (W&B) 是適合機器學習使用專家的開發人員堆疊。使用他們輕量的互通工具，在機器學習專案的整個生命週期期間進行偵錯和重製。W&B 受到超過 15 萬名機器學習使用專家的信任，這些專家使用 W&B 開發出更好的藥物、更安全的自駕車、更永續的農業和尖端的研究。

Weight & Biases 機器學習作業軟體經過認證，可和 NVIDIA DGX 系統配合使用，而且也適用於 NVIDIA Base Command 平台。

聯絡資訊

www.wandb.ai

Shakudo

Shakudo 的 Hyperplane 平台是機器學習團隊的端對端環境。Hyperplane 將最佳開放原始碼工具和框架結合，成為經過預先設定及調整的單一平台，主要目的是為開發人員提供最佳使用體驗。Shakudo 提供單一使用者介面和持續進化的多框架、多基礎架構後端，符合業界盛行的機器學習堆疊。在 NVIDIA DGX 系統上啟動和執行 Hyperplane 非常簡單，這項系統完全支援 RAPIDS™、NVIDIA Triton™ 推論伺服器、NVIDIA 多執行個體 GPU (MIG) 和其他強大的 NVIDIA 技術。Hyperplane 支援機器學習的整個生命週期，包含開發和實驗、擴充和部署模型，與擷取、轉換和載入 (ETL) 作業、實驗追蹤、監控，以及生產工作負載的即時疑難排解。

聯絡資訊

https://shakudo.io/dgx

Determined AI

Determined 是一個開放原始碼深度學習訓練平台，能更快速且輕鬆地建構模型。Determined 所提供的優勢：

無需更改模型程式碼，即可使用最先進的分散式訓練來加快模型訓練速度
利用 Hyperband 創作者調整的進階超參數，自動找到高品質模型
運用智慧排程技術，從 GPU 獲得更多資訊，並流暢使用先占執行個體降低雲端 GPU 成本
透過立即可用的實驗追蹤功能追蹤與重製工作成果，包括程式碼版本、指標、檢查點和超參數

聯絡資訊

www.determined.ai

D2iQ

D2iQ Kaptain 是一個企業就緒的端到端機器學習 (ML) 平台，由 Kubeflow 支援，透過打破 ML 原型和生產之間的障礙，加快上市時間和正投資回報率。D2iQ Kaptain 使組織能夠在混合和雲端環境中大規模開發和部署 ML 工作負載。

D2iQ Konvoy 是完整版本的 Kubernetes，可使採用 Kubernetes 的公司享有輕鬆且立即可用的企業級體驗。Konvoy 是由純上游開放原始碼軟體，以及為混合式和雲端環境大規模篩選、整合和測試量產所需的附加元件所構建而成。

聯絡資訊

https://d2iq.com/partners/nvidia

Run:AI

Run:AI 打造了全球第一款可編排和加速人工智慧的運算管理平台。Run:AI 將 GPU 運算資源集中和虛擬化，藉以提供能見度，並控制資源的優先順序和分配，同時簡化工作流程，為資料科學家省去基礎架構帶來的麻煩。如此一來，便能確保人工智慧專案與業務目標對應，並大幅提升資料科學團隊的生產力，讓他們可以在資源不受限制的情況下建構並訓練同步模型。

聯絡資訊

www.run.ai

Shakudo

Shakudo 的 Hyperplane 平台是機器學習團隊的端對端環境。Hyperplane 將最佳開放原始碼工具和框架結合，成為經過預先設定及調整的單一平台，主要目的是為開發人員提供最佳使用體驗。Shakudo 提供單一使用者介面和持續進化的多框架、多基礎架構後端，符合業界盛行的機器學習堆疊。在 NVIDIA DGX 系統上啟動和執行 Hyperplane 非常簡單，這項系統完全支援 RAPIDS™、NVIDIA Triton™ 推論伺服器、NVIDIA 多執行個體 GPU (MIG) 和其他強大的 NVIDIA 技術。Hyperplane 支援機器學習的整個生命週期，包含開發和實驗、擴充和部署模型，與擷取、轉換和載入 (ETL) 作業、實驗追蹤、監控，以及生產工作負載的即時疑難排解。

聯絡資訊

https://shakudo.io

Canonical Ubuntu

Canonical 的 Ubuntu 是 NVIDIA DGX、NVIDIA EGX™、NVIDIA NGC™ 容器等的最佳化平台，能讓資料科學家和工程師提高創新生產力。Canonical Kubernetes 以最佳化的 Ubuntu 影像為基礎，並為任何運算環境提供無與倫比的整合和作業。

此外，為了製定 AI 解決方案並擴展項目，可以將端對端 MLOps 平台 Canonical Kubeflow 添加到堆疊中並在 NVIDIA DGX 系統上運行。

聯絡資訊

https://ubuntu.com/nvidia#get-in-touch

IBM Spectrum LSF

IBM Spectrum^® LSF^® 套件組合是適用於高需求分散式運算環境的完整工作負載管理解決方案，可協助提升使用者生產力和硬體使用率，同時降低管理成本。LSF 套件支援典型的高效能運算 (HPC)、巨量資料、GPU、機器學習 (ML) 和人工智慧，以及位於本機和雲端的容器化工作負載。運用動態混合式雲端擴增和智慧資料暫存，可讓組織只支付使用的成本，進而能夠控制成本。

聯絡資訊

https://www.ibm.com/products/hpc-workload-management

SchedMD

SchedMD 是 Slurm 的核心開發人員和服務供應商，為雲端和本機叢集提供支援、諮詢、設定、開發和訓練服務。

Slurm 是領先業界的開放原始碼工作負載管理工具，專為最複雜且嚴苛的高效能運算、高輸送量運算 (HTC) 和人工智慧系統而設計。Slurm 可將工作負載輸送量和可靠性提升到最高，同時最佳化雲端和本機叢集的消耗和管理工作負載。

Slurm 為 NVIDIA GPU 提供關鍵排程技術：

Manages GPUs similar to CPUs with flexible control for requesting GPUs and binding tasks to the GPU (GPU=一流資源 )
支援 NVIDIA 多執行個體 GPU (MIG)
自動偵測 GPU 資源
將工作負載限制僅於指定分配的 GPU 處理，禁止流程使用超過要求的 GPU
設定 CUDA_VISIBLE_DEVICES 環境變數，讓工作能夠辨識分配的 GPU

聯絡資訊

www.schedmd.com/

聯絡我們，以深入瞭解相關資訊

Section

Section

名

姓

公司電子郵件

公司電話號碼

組織 / 大學名稱

產業

職稱

地區

偏好語言

您對 DGX 的疑問?

你對哪個產品有興趣？

州/省

nvid hidden field

enterpriseOptIns hidden field

我想收到 NVIDIA 關於企業端的最新消息、公告與更多訊息。我可以隨時取消訂閱。

NVIDIA 隱私權政策

我同意 NVIDIA <span class="corporation-txt hidden">Corporation </span>收集和处理上述信息,以进行研究和活动组织,我已阅读并同意 <a href="https://www.nvidia.com/zh-tw/about-nvidia/privacy-policy/?deeplink=visiting-our-website" target="_blank">隐私政策</a>。

我同意,由于研究、活动组织和NVIDIA内部管理及系统运行需要,以上信息将被转移到美国的NVIDIA公司,并以符合 <a href="https://www.nvidia.com/zh-tw/about-nvidia/privacy-policy/?deeplink=visiting-our-website" target="_blank">隐私政策</a> 的方式存储。您可以通过发送电子邮件至 <a href="mailto:privacy@nvidia.com">privacy@nvidia.com</a> 联系我们,以解决相关问题。

Privacy - Terms

適用於 NVIDIA DGX 系統的認證機器學習作業軟體

簡化人工智慧部署和工作流程

機器學習作業的人工智慧基礎架構

DGX-Ready 軟體解決方案

從 DGX 系統中取得更多資訊 使用機器學習作業

Weights & Biases

聯絡資訊

Backend.AI

聯絡資訊

Bright Computing

聯絡資訊

ClearML

更多資源

聯絡資訊

Shakudo

聯絡資訊

Domino Data Lab

更多資源

聯絡資訊

Determined AI

聯絡資訊

Iguazio

聯絡資訊

Paperspace

聯絡資訊

Red Hat OpenShift

聯絡資訊

Pachyderm

聯絡資訊

D2iQ

更多資源

聯絡資訊

Run:AI

更多資源

聯絡資訊

Shakudo

聯絡資訊

Canonical Ubuntu

更多資源

聯絡資訊

IBM Spectrum LSF

更多資源

聯絡資訊

SchedMD

更多資源

聯絡資訊

SUSE

資源

聯絡我們

Altair

更多資源

聯絡資訊

聯絡我們，以深入瞭解相關資訊

從 DGX 系統中取得更多資訊
使用機器學習作業