Visit your regional NVIDIA website for local content, pricing, and where to buy partners specific to your country.
IA de Voz y Traducción
Cree e implemente IA de voz y traducción multilingüe totalmente personalizable para su grande modelo de lenguaje y aplicaciones basadas en generación de recuperación aumentada.
Vídeo | Resumen de la Solución | Para Desarrolladores
NVIDIA® Riva es un conjunto de microservicios de voz y traducción multilingües acelerados por GPU para crear pipelines de IA conversacional en tiempo real totalmente personalizables. Riva incluye reconocimiento automático de voz (ASR), texto a voz (TTS) y traducción automática neuronal (NMT) y se puede implementar en todas las nubes, en data centers, en el edge y en dispositivos integrados. Con Riva, las organizaciones pueden agregar interfaces de voz y traducción con grandes modelos de lenguaje (LLM) y generación aumentada de recuperación (RAG) para transformar los chatbots en asistentes y avatares multilingües atractivos y expresivos.
Ofrezca chatbots de IA con transcripción, traducción y voces multilingües de última generación.
Logre una alta precisión de transcripción y traducción multilingüe y proporcione voces femeninas y masculinas profesionales, expresivas y listas para usar con modelos de última generación preentrenados con miles de horas de audio en supercomputadoras NVIDIA.
Personalice los pipelines de ASR para diferentes idiomas, acentos, dominios, vocabulario y contexto para obtener la mejor precisión posible para su caso de uso y los pipelines de TTS para la voz y la entonación de la marca que desee.
Proporcione experiencias coherentes a cientos de miles de usuarios simultáneos con un rendimiento de inferencia superior al de la tecnología existente, e impleméntelo en cualquier lugar: en data center, en las instalaciones, en la nube, en el edge o en dispositivos integrados.
Acelera el desarrollo y la implementación de aplicaciones de IA de nivel de producción, multilingües y habilitadas para voz con NVIDIA AI Enterprise, una plataforma de software nativa de la nube de extremo a extremo para IA generativa segura y estable de nivel empresarial.
Experimente los nuevos microservicios ASR, TTS y NMT ahora disponibles, diseñados para proporcionar inferencia de IA optimizada para IA de voz y traducción. Esto incluye los modelos Parakeet que ofrecen precisión y rendimiento de ASR de configuración de grabación.
Descubra cómo los líderes de la industria están impulsando la innovación con Riva.
Las empresas están implementando asistentes de preguntas y respuestas para abordar automáticamente las consultas de millones de clientes y empleados las 24 horas del día. Con los microservicios de inteligencia artificial de voz y traducción de Riva, estos asistentes brindan respuestas útiles y naturales en cada paso de la conversación a pesar del ruido de fondo, la mala calidad del sonido y los diversos dialectos y acentos de los hablantes.
Los consumidores esperan que los agentes del centro de contacto resuelvan sus problemas de manera rápida y eficiente. Para cumplir con estas expectativas y ofrecer las mejores experiencias posibles a los clientes y agentes, las empresas de todos los sectores están implementando la tecnología de asistencia a los agentes impulsada por la IA de voz y traducción de Riva.
Para mejorar las experiencias de servicio al cliente y construir relaciones sólidas con sus clientes, las empresas están creando avatares con voces de marca reconocibles. Con Riva, pueden crear una voz única, personalizada y de alta calidad con solo tres segundos de datos de voz.
Con cientos de millones de reuniones en línea realizadas diariamente, las videoconferencias se han convertido en una herramienta indispensable para las empresas. A través de la transcripción en tiempo real de Riva, las aplicaciones de videoconferencia logran una precisión impresionante en subtítulos en vivo y resúmenes de reuniones, acomodando a usuarios con acentos internacionales y diversos vocabularios específicos de dominio.
En la economía global, las empresas operan en todos los países y atienden a clientes con diversos orígenes lingüísticos y culturales. Esta diversidad en los idiomas globales plantea un desafío único, ya que contratar hablantes nativos y capacitar a los empleados en varios idiomas no es escalable, rentable ni eficiente. La traducción de Riva permite una comunicación precisa y eficaz, lo que facilita interacciones globales fluidas.
Los robots de servicio se encuentran cada vez más en hospitales, aeropuertos y tiendas minoristas de todo el mundo. Ayudan a los trabajadores de primera línea al realizar tareas repetitivas diarias en restaurantes e instalaciones de manufactura, ayudan a los clientes a localizar artículos en las tiendas y respaldan a los médicos y enfermeras en la atención al paciente. Con Riva, es fácil agregar IA de voz y traducción a los robots de servicio.
Utilice las herramientas y tecnologías adecuadas para crear e implementar aplicaciones de IA de voz y traducción multilingües y totalmente personalizables.
Experimente Riva a través de un portal basado en la interfaz de usuario para explorar y crear prototipos con terminales administrados por NVIDIA, disponible de forma gratuita a través del catálogo de API de NVIDIA.
Accede a la infraestructura alojada en NVIDIA y a los laboratorios prácticos guiados que incluyen instrucciones paso a paso y ejemplos, disponibles de forma gratuita en NVIDIA LaunchPad.
Obtén una licencia gratuita para probar NVIDIA AI Enterprise en producción durante 90 días con tu infraestructura existente.
Cliente: T-Mobile
Productos: NVIDIA Riva, Sistemas Certificados por NVIDIA
Tecnologías: GPU para Data Center NVIDIA, NVIDIA NeMo, NVIDIA Riva
Cliente: RingCentral
Productos: NVIDIA DGX, NVIDIA Riva
Tecnologías: GPU para Data Center NVIDIA, NVIDIA NeMo, NVIDIA Riva, Servidor de Inferencia NVIDIA Triton
Cliente: Tarteel.ai
Tecnologías: NVIDIA NeMo, NVIDIA Riva, GPU para Data Center de NVIDIA
¿Tiene un proyecto de IA del habla existente? Postúlate para obtener experiencia práctica probando y creando prototipos de tus soluciones basadas en conversaciones con habilidades de habla en la pila de software Riva de alto rendimiento que se puede implementar hoy.
Aprenda a crear, entrenar, ajustar e implementar un servicio de ASR acelerado por GPU con Riva que incluya funciones personalizadas.
Únase a los expertos en IA para aprender a crear, ajustar e implementar IA de voz y traducción multilingüe y lista para la producción sobre aplicaciones basadas en LLM, lo que permite que sus chatbots hablen con sus clientes en sus idiomas naturales.
Cree aplicaciones de IA de voz de clase mundial y totalmente personalizables, como asistentes virtuales inteligentes, servicios de transcripción de audio y avatares digitales.
Al generar una transcripción precisa de las interacciones con los clientes en tiempo real, Riva permite a la IA proporcionar información contextual, medir el sentimiento y recomendar la siguiente mejor acción a un agente, lo que garantiza una gran experiencia personalizada.
Mira cómo Spot usa la IA de voz para pedir bocadillos en toda la ciudad sin conexión a Internet. En lugar de cargar comandos de voz en la nube y procesarlos en el servidor, Spot procesa todo localmente para obtener un rendimiento y una entrega eficientes y sin problemas.
Comprenda las funciones clave de Riva que le ayudarán a crear servicios de IA de voz y traducción.
Obtenga todo lo que necesita para comenzar a construir sus procesos de IA de voz y traducción con NVIDIA Riva, incluidos tutoriales, Notebooks Jupyter y documentación.
Lea un tutorial técnico sobre cómo crear e implementar aplicaciones de IA de voz y traducción utilizando Riva.
Explore cómo comenzar a integrar e implementar modelos Riva ASR y TTS en producción con inferencia de alto rendimiento y mínimo esfuerzo.
Utilice las herramientas y tecnologías adecuadas para crear e implementar aplicaciones de IA de voz y traducción multilingües totalmente personalizables.
Explora todo lo que necesitas para empezar a desarrollar con NVIDIA Riva, incluida la documentación más reciente, tutoriales, blogs técnicos y mucho más.
Habla con un especialista en productos de NVIDIA sobre cómo pasar de piloto a producción con la seguridad, la estabilidad de la API y el soporte de NVIDIA AI Enterprise.
En 2021, AI2Labs se separó de Yoozoo Games como una startup tecnológica local en Singapur. AI2Labs innova, experimenta y desarrolla productos y aplicaciones de IA, permitiendo procesos eficientes y mejorando la sostenibilidad y los resultados comerciales.
AI2Labs integró Riva en su API de reconocimiento de voz Speakr (IA de voz de dominio específico) para adaptarse a las complejidades de los dominios comerciales y de voz asiáticos y logró una precisión de traducción en inglés de última generación.
Avaya se especializa en comunicaciones en la nube y soluciones de colaboración en workflow, brindando comunicaciones unificadas, centro de contacto, plataforma de comunicaciones como servicio (CPaaS) y servicios con su plataforma OneCloud.
Avaya integró el motor de voz a texto NVIDIA Riva para subtítulos en tiempo real a escala. Riva permite una mejor calidad de transcripción, una menor tasa de errores de palabras y una entrega económica.
Durante más de 10 años, el Applied AI Group de C-DAC en Pune, India, se ha centrado en la investigación y el desarrollo de tecnología del habla. Han creado con éxito un sistema de voz a texto (STT) de vanguardia para idiomas índicos como el hindi y el marathi. El grupo continúa avanzando en su trabajo explorando frameworks, bibliotecas y herramientas de deep learning de código abierto y habilitados para IA para crear aplicaciones STT y habilitadas para voz para otros idiomas índicos y de bajos recursos. Se realizaron experimentos utilizando varias arquitecturas y topologías de redes neuronales del framework NeMo de código abierto de NVIDIA, y las topologías de redes Citrinet y Conformer-CTC demostraron ser efectivas en la construcción y entrenamiento de modelos acústicos neuronales para el reconocimiento de voz. Estos modelos se entrenaron en sistemas de IA Param Siddhi de uno y varios nodos, optimizando el tiempo y el rendimiento del entrenamiento. Finalmente, los modelos se implementaron para inferencia en tiempo real y en modo por lotes utilizando el proceso de producción acelerado por GPU de Riva.
NCS, una subsidiaria de Singtel Group, es una firma líder de servicios tecnológicos con presencia en Asia Pacífico y se asocia con gobiernos y empresas para hacer avanzar a las comunidades a través de la tecnología. Combinando la experiencia y los conocimientos de su equipo de 12.000 personas en 61 especializaciones, NCS ofrece servicios de tecnología diferenciados y de extremo a extremo a los clientes con sus capacidades NEXT en digital, datos, nube y plataformas, así como ofertas principales en aplicaciones e infraestructura , ingeniería y ciberseguridad. NCS también cree en la construcción de un ecosistema de socios sólido con actores tecnológicos líderes, instituciones de investigación y empresas emergentes para apoyar la innovación abierta y la cocreación.
NCS utiliza NVIDIA Riva TTS en Breeze, la aplicación complementaria del conductor, para navegación guiada por voz, actualizaciones de tráfico y condiciones de la carretera en vivo, tarifas de estacionamiento en tiempo real y tarifas y horarios de operación electrónicos para ayudar a los conductores de Singapur a experimentar viajes de conducción sin problemas.
breeze.com.sg/
www.ncs.co
Historia del Cliente
RingCentral, un proveedor líder de soluciones globales de centros de contacto, colaboración y comunicaciones en la nube empresarial, presta servicios a millones de usuarios. La plataforma RingCentral permite la colaboración desde cualquier ubicación y dispositivo, mejorando la eficiencia empresarial y la satisfacción del cliente.
RingCentral utiliza NVIDIA Riva para la transcripción de videoconferencias para 200.000 usuarios simultáneos en su plataforma.
www.ringcentral.com
Sesión GTC
Snap es una empresa de cámaras y redes sociales que permite la creación de mensajes multimedia con filtros y efectos. Para crear experiencias más interactivas, los usuarios de Snapchat juegan con Lenses, una función que agrega efectos en tiempo real a las instantáneas, más de 6 mil millones de veces al día.
El servicio de IA del habla optimizado para ruido y jerga de NVIDIA Riva está integrado en Snap AR Lens Studio, lo que permite a los creadores (artistas y desarrolladores) crear apasionantes experiencias de realidad aumentada (AR).
T-Mobile, un Un-carrier supercargado, ofrece una red 4G LTE avanzada y una red 5G transformadora para la mejor experiencia del cliente. Para empoderar a los agentes del centro de contacto, T-Mobile implementa Expert Assist. Este software basado en IA utiliza NVIDIA Riva para transcribir conversaciones de clientes en tiempo real que alimentan a los recomendadores y ayudan a miles de agentes.
Con Riva, T-Mobile afina los modelos de reconocimiento automático de voz en conjuntos de datos personalizados e interpreta con precisión la jerga de los clientes en entornos ruidosos.
www.t-mobile.com
Responderemos a sus preguntas y ayudaremos con las necesidades de su organización.
Política de Privacidad de NVIDIA