Riva fournit des modèles de reconnaissance vocale automatique (ASR), de synthèse vocale (TTS) et de traduction automatique neuronale (NMT) basés sur le Deep Learning pour les développeurs et les professionnels de l'IA. Les modèles d'ASR, de TTS et de NMT font appel à des interfaces vocales dans les applications reposant sur l'IA vocale telles que les systèmes d'assistance aux agents dans les centres d'appels, les assistants numériques et les transcriptions d'appels vidéo, tout en facilitant la mise en œuvre de superchats d'IA basés sur de grands modèles de langage (LLM) et la génération augmentée par récupération (RAG).
L'ASR permet de convertir la parole en texte et constitue généralement la première étape d'un pipeline d'IA conversationnelle, c'est pourquoi la précision de ses performances de transcription influe sur toutes les tâches en aval. La TTS génère des voix humaines de synthèse à partir d'un contenu au format texte. La NMT traduit des mots d’une langue à une autre.
Riva est utilisé dans tous les secteurs, des télécommunications à la finance en passant par la santé, la vente au détail et l’automobile, soit partout où l'entreprise a besoin d’interagir avec ses clients.