O Riva fornece modelos de reconhecimento automático de fala (ASR), conversão de texto em fala (TTS) e tradução automática neural (NMT) baseados em deep learning para profissionais e desenvolvedores de IA. ASR, TTS e NMT são interfaces de voz em aplicações baseadas em IA de fala, como assistências de agentes de call center, assistentes digitais, transcrições de chamadas de vídeo e superchats de IA orientados por grandes modelos de linguagem (LLMs) e geração aumentada por recuperação (RAG).
O ASR converte fala em texto e geralmente é a primeira etapa em um pipeline de conversação, portanto, sua precisão de transcrição influencia todas as tarefas downstream. O TTS gera vozes semelhantes às humanas a partir do texto. NMT traduz palavras de um idioma para outro.
O Riva é usado em todos os setores, desde telecomunicações e finanças até saúde, varejo e automotivo, onde quer que as empresas interajam com os clientes.