在本實作過程中,回答問題 (QA) 和語言推論等自然語言處理工作是使用 NVIDIA Base Command™ 完成。運用多個 NVIDIA DGX™ A100 640GB 系統,以公開可用的純文字預先訓練自己高精準度的 BERT 模型。
在本實作過程中,在多 GPU、多節點 NVIDIA DGX™ 系統上訓練大型 Transformer 語言模型。您會發現堆疊中的所有元件,從晶片、網路到軟體,都經過最佳化且由 GPU 加速,藉此保證您能以最快速度進行訓練。針對 GPT-3 模型使用預先微調超參數配置,藉此開始企業對大型語言模型 (LLM) 的運用。