이 랩에서는 NVIDIA Base Command™를 사용하여 질문 응답(QA) 및 언어 추론과 같은 NLP 작업을 수행합니다. 여러 NVIDIA DGX™ A100 640GB 시스템을 활용하여 공개적으로 사용 가능한 일반 텍스트에 매우 정확한 BERT 모델을 사전 트레이닝합니다.
이 랩에서는 멀티 GPU, 멀티 노드 NVIDIA DGX™ 시스템에서 대규모 트랜스포머 기반 언어 모델을 트레이닝합니다. 실리콘에서 네트워크, 소프트웨어에 이르기까지 스택의 모든 구성 요소가 최적화되고 GPU로 가속되어 가장 빠른 훈련 시간을 제공합니다. GPT-3 모델에 대해 미리 조정된 하이퍼 매개 변수 구성을 사용하여 엔터프라이즈의 LLM(대규모 언어 모델) 여정을 부트스트랩합니다.