Современные системы ИИ для обработки речи используют модели глубокой нейронной сети (DNN), обученные на массивных наборах данных. Со временем размер моделей ИИ для обработки речи вырос настолько, что их обучение может занять недели интенсивных вычислений, даже при использовании фреймворков глубокого обучения, таких как PyTorch, TensorFlow и MXNet, на высокопроизводительных графических процессорах.
Платформа NVIDIA Speech AI предлагает в каталоге NVIDIA NGC™ модели производственного класса, предварительно обученные на нескольких общедоступных и собственных наборах данных в течение сотен тысяч часов в системах NVIDIA DGX™.