Visit your regional NVIDIA website for local content, pricing, and where to buy partners specific to your country.
Microsoft Teams enables highly accurate live meeting captioning and transcription services in 28 languages.
Microsoft Teams
Microsoft Azure
Subtítulos y transcripción de reuniones en varios idiomas en tiempo real
Servicios Cognitivos de Microsoft Azure, GPU NVIDIA en Azure, Servidor de Inferencia NVIDIA Triton
Microsoft Teams es una aplicación de colaboración con casi 250 millones de usuarios activos mensuales. Para adaptarse mejor a los hablantes no nativos y a los asistentes a reuniones que son sordos o tienen problemas de audición, Microsoft confía en subtítulos en vivo y transcripciones en tiempo real generados por IA.
Para obtener subtítulos en vivo y transcripciones óptimos en varios idiomas, la aplicación Microsoft Teams utiliza los Servicios Cognitivos de Microsoft Azure y el Servidor de Inferencia NVIDIA Triton™. Esto les permite aprovechar modelos de lenguaje avanzados que reconocen jerga, nombres y otros contextos de reuniones para ofrecer resultados de voz a texto personalizados y altamente precisos, en tiempo real, con una latencia muy baja.
El uso del Servidor de Inferencia Triton en los Servicios Cognitivos de Azure permite transcripción en vivo y subtítulos con modelos de voz de última generación en 28 idiomas. El Servidor de Inferencia Triton ofrece inferencia en tiempo real y baja latencia de los modelos de reconocimiento de voz y garantiza que los modelos utilicen las GPU en todo su potencial. Esto reduce el costo para los clientes al ofrecer un mayor rendimiento utilizando menos recursos computacionales.
Resultados
Microsoft Teams es una aplicación de colaboración creada para el trabajo híbrido que permite a los equipos mantenerse informados, organizados y conectados, todo en un solo lugar. Los clientes utilizan equipos para comunicarse, colaborar y ser coautores de contenido en el trabajo, la vida y el aprendizaje, todos los días.
“Los modelos de IA como estos son increíblemente complejos y requieren decenas de millones de parámetros de redes neuronales para ofrecer resultados precisos en docenas de idiomas diferentes. Pero cuanto más grande es un modelo, más difícil es ejecutarlo de manera rentable en tiempo real”.
Gerente Principal de PM para Llamadas e Reuniones en Teams y Dispositivos Microsoft