IA vocale
Développez et déployez des modèles multilingues d'IA vocale et de traduction entièrement personnalisables pour vos grands modèles linguistiques et vos applications basées sur la génération augmentée par récupération.
Vidéo | Fiche produit | Pour les développeurs
NVIDIA® Riva constitue un ensemble de microservices multilingues de reconnaissance vocale et de traduction accélérés par GPU, qui permettent de concevoir des pipelines d’IA conversationnelle entièrement personnalisables en temps réel. Riva inclut des fonctionnalités de reconnaissance vocale automatique (ASR), de synthèse vocale (TTS) et de traduction automatique neuronale (NMT). Cette technologie peut être déployée sur n’importe quel système Cloud, sur Data Center, à l'Edge ou sur des systèmes Embedded. Grâce à Riva, les entreprises peuvent se doter de capacités avancées de reconnaissance vocale et de traduction via de grands modèles de langage (LLM) ou des techniques de génération augmentée par récupération (RAG), de manière à transformer les chatbots en assistants et avatars multilingues à haut degré d'efficacité.
Mettez en œuvre des chatbots basés sur l’IA avec des fonctionnalités avancées de transcription, de traduction et de reconnaissance vocale multilingues.
Sélectionnez votre langue et découvrez la précision extrême de la transcription fournie en temps réel par Riva ASR, que ce soit en enregistrant une commande via votre micro ou en téléchargeant un fichier.wav depuis votre système.
Remarque : la durée de chaque échantillon est limitée à 30 secondes.
Sélectionnez une voix et saisissez une phrase de test pour entendre la voix masculine ou féminine de Riva en anglais.
Remarque : le texte à saisir est limité à 400 caractères.
0 / 400
L’utilisation des fonctionnalités de Riva est soumise aux Conditions d’utilisation de NVIDIA Riva. Vos données seront utilisées pour améliorer les produits et les services de NVIDIA.
Bénéficiez d’une précision de transcription élevée pour vos traductions bilingues ou multilingues, et profitez de voix féminines et masculines professionnelles et expressives grâce à des modèles de pointe pré-entraînés via des milliers d’heures de données audio sur les supercalculateurs de NVIDIA.
Profitez de la personnalisation permise par les pipelines ASR concernant les langues, les accents, les domaines, le vocabulaire et le contexte pour obtenir une précision optimale et parfaitement adaptée à votre cas d’utilisation, et exploitez les pipelines TTS pour trouver la voix et l'intonation que vous souhaitez.
Fournissez des expériences fiables à vos clients avec des centaines de milliers de flux d’entrée proposant des performances d’inférence supérieures à celles des technologies existantes ainsi qu'un choix de déploiements à la carte : sur Data Center, sur site, dans le Cloud, à l'Edge ou sur des systèmes Embedded.
Utilisez les bons outils pour concevoir et déployer des applications d’IA vocale et de traduction multilingues entièrement personnalisables.
Pour les particuliers qui souhaitent essayer Riva, lancez-vous grâce au catalogue d’API, qui propose un terrain de test basé sur une interface utilisateur et un accès gratuit à des points de terminaison d’API gérés par NVIDIA.
Pour les entreprises qui souhaitent tester Riva avant d’acheter des produits NVIDIA AI Enterprise pour la production, deux options s’offrent à vous :
Sans infrastructure : Si vous ne disposez pas d'une infrastructure existante, NVIDIA vous propose des ateliers gratuits via NVIDIA LaunchPad.
Avec infrastructure : Si vous disposez d’une infrastructure existante, NVIDIA vous propose une licence d’évaluation gratuite de 90 jours pour NVIDIA AI Enterprise.
T-Mobile uses NVIDIA Riva ASR in their call center to accurately transcribe customer conversations and provide real-time recommendations to help agents quickly resolve customer queries.
T-Mobile utilise NVIDIA Riva ASR dans son centre d’appels pour réaliser une transcription précise des conversations des clients, mais aussi fournir des recommandations en temps réel aux agents afin de traiter rapidement les requêtes des clients.
NCS a utilisé NVIDIA Riva TTS pour personnaliser une voix singapourienne avec une prononciation, un ton et un accent locaux pour des dizaines de milliers d’utilisateurs actifs de Breeze, une application d'aide à la conduite.
Tarteel exploite NVIDIA Riva et NVIDIA NeMo pour fournir un retour en temps réel sur les programmes de lecture du Coran à grande échelle, permettant ainsi aux musulmans, aux instructeurs, aux créateurs de contenu et aux chercheurs d’interagir de manière optimale avec le Coran.
Grâce à NVIDIA Riva, RingCentral a atteint une précision de transcription en temps réel exceptionnelle pour des réunions en visioconférence pouvant impliquer des millions d’utilisateurs dans le monde, avec une prise en compte des accents et des terminologies spécifiques.
Data Monsters a intégré un pipeline d'IA vocale à l’application Plabook en utilisant NVIDIA Riva pour aider les étudiants à lire du contenu, évaluer la précision au niveau des phonèmes et expérimenter un feedback personnalisé.
Artisight a développé des solutions hospitalières intelligentes qui automatisent la prise en charge des patients et les préviennent via des bornes à commande vocale. Ces solutions intègrent une application d'IA vocale personnalisée et délivrent des performances en temps réel grâce à l’accélération GPU de NVIDIA Riva pour la synthèse vocale.
Découvrez comment AT&T, Kore.ai, Deloitte et Sutherland tirent parti de l’utilisation des fonctionnalités d'ASR, de traduction et de TTS multilingues pour mettre en œuvre un libre-service client plus rapide et plus précis, mais aussi pour améliorer la productivité de leurs agents et renforcer l’efficacité opérationnelle de leurs entreprises.
Rencontrez un expert en Data Science et en technologies d'IA qui vous présente les solutions de pointe d'IA vocale et de traduction de NVIDIA Riva pour révolutionner toute l’industrie, des assistants virtuels et des avatars numériques aux systèmes avancés de détection des fraudes et de réduction des risques, en passant par la gestion des sinistres, des commandes et de l’approvisionnement.
Regardez ce webinaire à la demande pour apprendre à concevoir des assistants virtuels intelligents sous la forme d'agents numériques à commande vocale. Nous vous expliquerons comment déployer des solutions polyvalentes et entièrement personnalisables pour améliorer la satisfaction de vos clients.
Découvrez comment Motorola et Softserve assurent une transcription et une traduction plus précises ainsi qu'une génération de voix plus attrayantes, avec la vitesse et l'évolutivité requises par les nouvelles expériences d’IA conversationnelle.
Watch this on-demand webinar to learn how speech AI is revolutionizing customer experiences in finance, broadcasting, and retail by removing barriers across languages and dialects, driving operational efficiency, and helping businesses stay ahead by improving accuracy and enhancing performance.
Watch Infosys, Quantiphi, Talkmap, and NVIDIA on-demand to learn how telecommunications companies are using AI to improve operational efficiency and enhance customer engagement.
Learn best practices from Infosys and Quantiphi for seamlessly integrating speech and translation AI into agent-assist solutions, ensuring smooth and effective customer-agent communication.
Watch T-Mobile as they walk through their model development with NVIDIA NeMo, cloud deployment with NVIDIA Riva, their efforts to identify and remove bias in their models, and the future of speech-to-text at T-Mobile.
Join Motorola and Softserve to learn how to deliver the most accurate transcription, translation, and engaging voices at the speed and scale conversational AI experiences demand.
Formez-vous aux principales fonctionnalités de Riva qui peuvent vous aider à créer des services d’IA vocale et de traduction.
Obtenez tout ce dont vous avez besoin pour commencer à développer vos pipelines d’IA vocale et de traduction avec NVIDIA Riva, y compris des didacticiels, des notebooks Jupyter et de la documentation.
Consultez notre présentation technique relative à la conception et au déploiement d’applications d’IA vocale et de traduction avec Riva.
Prenez connaissance de la manière dont vous pouvez commencer à intégrer et à déployer en production les modèles d’ASR et de TTS de Riva avec une inférence à hautes performances et un minimum d’efforts.
Trouvez la licence adaptée à la conception et au déploiement d’applications d'IA vocale et de traduction multilingues entièrement personnalisables, ou découvrez d'autres ressources de développement.
Discutez avec un spécialiste des produits NVIDIA pour savoir comment passer du stade de pilote à la phase de production en bénéficiant de la sécurité, de la stabilité d'API et du support de NVIDIA AI Enterprise.
Inscrivez-vous pour recevoir les dernières informations et annonces de NVIDIA.
En 2021, AI2Labs s'est détaché de Yoozoo Games pour devenir une startup technologique locale à Singapour. AI2Labs innove, expérimente et développe des produits et des applications d’IA, ce qui permet de mettre en œuvre des processus plus efficaces et d’améliorer la durabilité et les résultats commerciaux.
AI2Labs a intégré Riva à son Speakr, une API de reconnaissance vocale spécifique à un domaine, pour prendre en charge les subtilités des domaines du langage et des affaires asiatiques, tout en parvenant à une précision de pointe pour la traduction Singlish.
Avaya est une société spécialisée dans les solutions de communication dans le Cloud et de collaboration en matière de workstream, qui fournit des communications unifiées, des centres de contact, des plateformes de communication en tant que service (CPaaS) et des services avec leur plateforme OneCloud.
Avaya a intégré le moteur de synthèse vocale NVIDIA Riva pour le sous-titrage en temps réel à grande échelle. Riva offre une meilleure qualité de transcription, un taux d’erreur des mots plus faible et une livraison économique.
For over 10 years, the Applied AI Group at C-DAC in Pune, India, has focused on research and development of speech technology. They’ve successfully created a cutting-edge speech-to-text (STT) system for Indic languages such as Hindiand Marathi. The group continues to advance their work by exploring AI-enabled, open-source deep learning frameworks, libraries, and tools for creating STT and speech-enabled applications for other Indic and low-resource languages. Experiments were conducted using various neural network architectures and topologies from NVIDIA’s open-source NeMo framework, with Citrinet and Conformer-CTC network topologies proving to be effective in building and training neural acoustic models for speech recognition. These models were trained on single- and multi-node Param Siddhi AI systems, optimizing training time and performance. Finally, the models were deployed for real-time and batch-mode inference using the Riva GPU-accelerated production pipeline.
NCS, filiale de Singtel Group, est une société de services technologiques de premier plan présente en Asie-Pacifique et associée à des gouvernements et à des entreprises pour faire avancer les communautés grâce à la technologie. En combinant l’expérience et l’expertise de ses 12 000 collaborateurs répartis dans 61 spécialisations, NCS fournit des services technologiques différenciés et de bout en bout aux clients avec leurs capacités NEXT en matière de numérique, de données, de Cloud et de plateformes, ainsi que des offres de base en matière d’applications, d’infrastructures, d’ingénierie et de cybersécurité. NCS s’est par ailleurs associé à des acteurs technologiques, des instituts de recherche et des start-ups pour soutenir l’innovation libre et la co-création.
NCS utilise NVIDIA Riva TTS dans Breeze, l’application compagnon du conducteur, pour la navigation à guidage vocal, la mise à jour du trafic et de l’état de la route, les taux de stationnement en temps réel, les tarifs électroniques de tarification routière et les heures d’exploitation, afin d’aider les conducteurs singapouriens à vivre des trajets en toute fluidité.
breeze.com.sg/
www.ncs.co
Customer Story
RingCentral, un fournisseur majeur de solutions mondiales de communication, de collaboration et de centres de contact dans le Cloud d’entreprise, propose des services à des millions d’utilisateurs. La plateforme RingCentral facilite la collaboration depuis n’importe quel appareil et n’importe où, améliorant ainsi l’efficacité commerciale et la satisfaction des clients.
RingCentral utilise NVIDIA Riva pour la transcription de visioconférences pour 200 000 utilisateurs simultanés sur sa plateforme.
www.ringcentral.com
GTC Session
Snap est une société de caméra et de médias sociaux qui permet la création de messages multimédia avec des filtres et des effets. Pour créer des expériences plus interactives, les utilisateurs de Snapchat jouent avec des Lens, une fonctionnalité qui ajoute des effets en temps réel dans les captures d’écran, plus de 6 milliards de fois par jour.
Le service d’IA vocale optimisé pour le bruit et le lingo de NVIDIA Riva est intégré à Snap AR Lens Studio, ce qui permet aux créateurs, aux infographistes et aux développeurs, de concevoir des expériences captivantes de réalité augmentée (AR).
T-Mobile, un transporteur suralimenté, offre un réseau 4G LTE avancé et un réseau 5G transformateur pour la meilleure expérience client. Pour responsabiliser les agents du centre de contact, T-Mobile met en place Expert Assist. Ce logiciel basé sur l’IA utilise NVIDIA Riva pour la transcription des conversations avec les clients en temps réel afin d’alimenter les systèmes de recommandation et d’aider des milliers d’agents.
Avec Riva, T-Mobile optimise les modèles de reconnaissance vocale sur des jeux de données personnalisés et interprète le jargon du client avec précision dans les environnements bruyants.
www.t-mobile.com
Nous répondrons à vos questions et vous aiderons à répondre aux besoins de votre organisation.
Déclaration de confidentialité de NVIDIA