Riva proporciona modelos de reconocimiento automático de voz (ASR) basados en aprendizaje profundo, convertidor de texto a voz (TTS) y traducción automática neuronal (NMT) para profesionales y desarrolladores de IA. ASR, TTS y NMT son interfaces de voz en aplicaciones de voz basadas en IA, como asistentes de agente de centro de llamadas, asistentes digitales, transcripciones de videollamadas y superchats de IA impulsados por modelos de lenguaje de gran tamaño (LLM) y generación aumentada por recuperación (RAG).
El ASR convierte la voz en texto y, por lo general, es el primer paso de una canalización conversacional, por lo que la precisión de su transcripción influye en todas las tareas secundarias. La TTS genera voces similares a las humanas a partir de texto. La NMT traduce palabras de un idioma a otro.
Riva se utiliza en todos los sectores, desde las telecomunicaciones y las finanzas hasta la asistencia sanitaria, la venta minorista y la automoción, en las que las empresas interactúan con los clientes.