IA de voz y traducción
Cree e implemente IA de voz y traducción multilingüe totalmente personalizable para sus aplicaciones basadas en generación aumentada y modelos de lenguaje de gran tamaño.
Video | Resumen de soluciones | Para desarrolladores
NVIDIA® Riva es un conjunto de microservicios multilingües de voz y traducción, acelerados por GPU, para crear procesos de IA conversacional en tiempo real totalmente personalizables. Riva incluye reconocimiento de voz automático (ASR), conversión de texto a voz (TTS) y traducción automática neuronal (NMT), y puede implementarse en cualquier nube, en centros de datos, en el perímetro y en dispositivos integrados. Con Riva, las organizaciones pueden añadir interfaces de voz y traducción con modelos de lenguaje de gran tamaño (LLM) y generación aumentada por recuperación (RAG) para transformar los chatbots en asistentes y avatares multilingües atractivos y expresivos.
Ofrezca chatbots de IA con transcripción, traducción y voces multilingües de última generación.
Consiga un alto grado de precisión en la transcripción y traducción multilingüe, y ofrezca voces profesionales, tanto femeninas como masculinas, a través de modelos de última generación entrenados previamente con miles de horas de audio en los superordenadores de NVIDIA.
Personalice los procesos ASR para los distintos idiomas, acentos, dominios, vocabulario y contexto para lograr la mayor precisión posible en su caso particular, además de en todos los procesos TTS para dar con la voz y el tono de marca que quiera.
Proporcione experiencias consistentes a cientos de miles de usuarios simultáneos gracias al mayor rendimiento de inferencia sobre las tecnologías existentes, e implemente en cualquier lugar, ya sea en centros de datos, en las instalaciones, en la nube, en el perímetro o en dispositivos integrados.
Acelere el desarrollo y la implementación de aplicaciones de IA de producción multilingües y habilitadas por voz gracias a NVIDIA AI Enterprise, una plataforma de software integral nativa en la nube que ofrece una IA generativa segura y estable para empresas.
Experimenta los nuevos microservicios ASR, TTS y NMT disponibles ahora, diseñados para proporcionar una inferencia de IA optimizada para la IA de voz y traducción. Esto incluye modelos de Parakeet que ofrecen una gran precisión y rendimiento ASR en ajustes de grabación.
Descubra cómo los líderes del sector impulsan la innovación con Riva.
Cada vez más empresas implementan asistentes para sus preguntas y respuestas, a través de los cuales pueden responder automáticamente a las consultas de millones de clientes y empleados. Gracias a los microservicios de IA de voz y traducción de Riva, estos asistentes pueden ofrecer respuestas útiles y naturales en todo momento, independientemente del ruido de fondo, la mala calidad del sonido y los distintos dialectos y acentos de los interlocutores.
Los consumidores esperan que los agentes de los centros de contacto resuelvan sus problemas de forma rápida y eficiente. Para cumplir con estas expectativas y ofrecer las mejores experiencias posibles tanto a clientes como a agentes, las empresas de todos los sectores están implementando la tecnología de asistencia a agentes impulsada por la IA de voz y traducción de Riva.
Para mejorar las experiencias de servicio al cliente y fomentar las relaciones sólidas con sus clientes, las empresas se esfuerzan por crear avatares con voces de marca fácilmente reconocibles. Gracias a Riva, pueden crear una voz única, de alta calidad y personalizada con tan solo tres segundos de datos de voz.
Se celebran cientos de millones de reuniones en línea cada día y esto ha hecho que las videoconferencias se hayan convertido en una herramienta indispensable para las empresas. Gracias a la transcripción en tiempo real de Riva, las aplicaciones de videoconferencias consiguen una precisión asombrosa en la subtitulación en directo y los resúmenes de las reuniones, lo que permite a los usuarios disfrutar de los acentos de todo el mundo y de los diversos vocabularios específicos a cada dominio.
En la economía global, las empresas operan en todos los países y atienden a clientes con diversos orígenes lingüísticos y culturales. Esta diversidad de idiomas global plantea un desafío único, ya que contratar a hablantes nativos y capacitar a los empleados en varios idiomas no es factible, rentable ni eficiente. La traducción de Riva hace posible una comunicación precisa y eficaz, facilitando las interacciones globales de manera fluida.
Los robots de servicio son cada vez más frecuentes en hospitales, aeropuertos y pequeños comercios de todo el mundo. Ofrecen apoyo a los trabajadores en primera línea a la hora de realizar tareas repetitivas cotidianas en restaurantes y fábricas, ayudan a los clientes a encontrar artículos en las tiendas y ayudan tanto a médicos como a enfermeras en la atención a los pacientes. Con Riva, es fácil añadir IA de voz y traducción a los robots de servicio.
Utilice las herramientas y tecnologías adecuadas para crear e implementar aplicaciones de IA de voz y traducción multilingües totalmente personalizables.
Experimente Riva a través de un portal basado en la interfaz de usuario para explorar y crear prototipos con terminales gestionados por NVIDIA, disponibles de forma gratuita a través del catálogo de la API de NVIDIA.
Acceda a la infraestructura alojada en NVIDIA y a laboratorios prácticos guiados que incluyen instrucciones y ejemplos paso a paso, disponibles de forma gratuita en NVIDIA LaunchPad.
Consiga una licencia gratuita para probar NVIDIA AI Enterprise en producción durante 90 días utilizando su infraestructura existente.
Cliente: T-Mobile
Productos: NVIDIA Riva, sistemas certificados por NVIDIA
Tecnologías: GPU de centros de datos NVIDIA, NVIDIA NeMo, NVIDIA Riva
Cliente: RingCentral
Productos: NVIDIA DGX, NVIDIA Riva
Tecnologías: GPU de centros de datos NVIDIA, NVIDIA NeMo, NVIDIA Riva, servidor de inferencia NVIDIA Triton
Cliente: Tarteel.ai
Productos: NVIDIA Riva, NVIDIA-Certified Systems
Tecnologías: NVIDIA NeMo, NVIDIARiva, GPU de centro de datos NVIDIA
¿Tiene un proyecto de IA de voz existente? Presente una solicitud para recibir experiencia práctica probando y creando prototipos de tus propias soluciones basadas en conversaciones con habilidades de voz en la pila de alto rendimiento del software Riva, disponible para implementarla hoy mismo.
Aprenda a crear, entrenar, ajustar e implementar un servicio ASR acelerado por GPU con Riva que incluye características personalizadas.
Únase a los expertos de la IA para aprender a crear, ajustar e implementar IA de voz y traducción multilingüe, lista para la producción, además de aplicaciones basadas en los grandes modelos de lenguaje, permitiendo que sus chatbots hablen con sus clientes en sus lenguas maternas.
Cree aplicaciones de IA de voz totalmente personalizables, como asistentes virtuales inteligentes, servicios de transcripción de audio y avatares digitales.
Mediante la generación de una transcripción precisa de las interacciones con los clientes en tiempo real, Riva permite a la IA proporcionar ideas contextuales, evaluar el sentimiento y recomendar las reacciones adecuadas a los agentes, garantizando una excepcional experiencia personalizada.
Mire cómo Spot utiliza la IA de voz para pedir bocadillos por la ciudad sin necesidad de estar conectado a Internet. En lugar de cargar comandos de voz a la nube y procesarlos en el servidor, Spot lo procesa todo directamente para obtener un rendimiento y unos resultados eficientes y fluidos.
Utilice las herramientas y tecnologías adecuadas para crear e implementar aplicaciones de IA de voz y traducción multilingües, totalmente personalizables.
Explore todo lo que necesite para empezar a desarrollar con NVIDIA Riva, incluidas las últimas documentaciones, tutoriales, blogs técnicos y mucho más.
Talk to an NVIDIA product specialist about moving from pilot to production with the security, API stability, and support of NVIDIA AI Enterprise.
In 2021, AI2Labs spun off from Yoozoo Games as a local tech startup in Singapore. AI2Labs innovates, experiments, and develops AI products and applications, enabling efficient processes and improving sustainability and business outcomes.
AI2Labs integrated Riva into their Speakr—domain-specific speech AI—speech recognition API to accommodate the intricacies of Asian speech and business domains and achieved state-of-the-art Singlish translation accuracy.
Avaya se especializa en comunicaciones en la nube y soluciones de colaboración de flujo de trabajo, proporcionando comunicaciones unificadas, centro de contacto, plataforma de comunicaciones como servicio (CPaaS) y servicios con su plataforma OneCloud.
Avaya ha integrado el motor de voz a texto de NVIDIA Riva para subtítulos en tiempo real a escala. Riva mejora la calidad de la transcripción, reduce la tasa de errores de palabras y ofrece una entrega económica.
For over 10 years, the Applied AI Group at C-DAC in Pune, India, has focused on research and development of speech technology. They’ve successfully created a cutting-edge speech-to-text (STT) system for Indic languages such as Hindiand Marathi. The group continues to advance their work by exploring AI-enabled, open-source deep learning frameworks, libraries, and tools for creating STT and speech-enabled applications for other Indic and low-resource languages. Experiments were conducted using various neural network architectures and topologies from NVIDIA’s open-source NeMo framework, with Citrinet and Conformer-CTC network topologies proving to be effective in building and training neural acoustic models for speech recognition. These models were trained on single- and multi-node Param Siddhi AI systems, optimizing training time and performance. Finally, the models were deployed for real-time and batch-mode inference using the Riva GPU-accelerated production pipeline.
NCS, una filial de Singtel Group, es una empresa líder en servicios tecnológicos con presencia en Asia Pacífico y se asocia con gobiernos y empresas para avanzar en las comunidades a través de la tecnología. Al combinar la experiencia y los conocimientos de su equipo de 12 000 personas en 61 especializaciones, NCS proporciona servicios tecnológicos diferenciados e integrales a los clientes con sus funcionalidades NEXT en plataformas, nube y datos digitales, así como ofertas básicas en aplicaciones, infraestructura, ingeniería y ciberseguridad. NCS también cree en la creación de un ecosistema de partners sólido con los principales agentes tecnológicos, instituciones de investigación y startups que apoyen la innovación y la creación conjunta abiertas.
NCS utiliza NVIDIA Riva TTS in Breeze, la aplicación complementaria del conductor, para la navegación guiada por voz, actualizaciones del tráfico y el estado de la carretera en directo, tarifas de estacionamiento en tiempo real, tarifas de precios de peaje electrónico y horas de funcionamiento, para ayudar a los conductores de Singapur a experimentar trayectos de conducción fluidos.
breeze.com.sg/
www.ncs.co
Customer Story
RingCentral, un proveedor líder de soluciones globales de comunicaciones en la nube empresariales, colaboración y centros de contacto, atiende a millones de usuarios. La plataforma RingCentral permite la colaboración desde cualquier ubicación y dispositivo, lo que mejora la eficiencia empresarial y la satisfacción del cliente.
RingCentral utiliza NVIDIA Riva para la transcripción de videoconferencias para 200 000 usuarios simultáneos en su plataforma.
www.ringcentral.com
GTC Session
Snap es una empresa de cámaras y redes sociales que permite la creación de mensajes multimedia con filtros y efectos. Para crear experiencias más interactivas, los usuarios de Snapchat juegan con Lenses, una característica que añade efectos en tiempo real a las instantáneas, más de 6 mil millones de veces al día.
El servicio de IA de voz optimizado para ruido y Lingo de NVIDIA Riva se integra en Snap AR Lens Studio, lo que permite a los creadores (artistas y desarrolladores) crear experiencias de realidad aumentada (AR) emocionantes.
T-Mobile, un Un-carrier sobrecargado, ofrece una avanzada red 4G LTE y 5G transformadora para la mejor experiencia del cliente. Para capacitar a los agentes del centro de contacto, T-Mobile implementa Expert Assist. Este software basado en IA utiliza NVIDIA Riva para transcribir conversaciones de clientes en tiempo real que proporcionan recomendaciones y ayudan a miles de agentes.
Con Riva, T-Mobile ajusta los modelos de reconocimiento automático de voz en conjuntos de datos personalizados e interpreta la jerga del cliente con precisión en entornos ruidosos.
www.t-mobile.com
Responderemos a sus preguntas y ayudaremos con las necesidades de su organización.
Política de privacidad de NVIDIA
Explore how to get started with integrating and deploying Riva ASR and TTS models in production with high-performance inference and minimal effort.
Learn about Riva’s architecture, key features, and components for building speech and translation AI services.
Read how a team of NVIDIANs won the LIMMITS ’24 challenge, which asked contestants to recreate in real time a speaker’s voice in English or any of six languages spoken in India with the appropriate accent.