IA vocale e di traduzione

NVIDIA Riva

Crea e distribuisci l'IA per discorsi e traduzioni multilingue completamente personalizzabile per il tuo modello linguistico di grandi dimensioni e applicazioni basate su generazione aumentata di recupero..

Panoramica

Cos'è NVIDIA Riva?

NVIDIA Riva è un set di microservizi vocali e di traduzione multilingue accelerati da GPU per la creazione di pipeline di IA conversazionale completamente personalizzabili in tempo reale. Riva include il riconoscimento vocale automatico (ASR), il text-to-speech (TTS) e la traduzione automatica neurale (NMT) ed è implementabile in tutti i cloud, nei data center, nell’edge e nei dispositivi integrati. Con Riva, le organizzazioni possono aggiungere interfacce vocali e di traduzione con modelli linguistici di grandi dimensioni (LLM) e recupero di generazione aumentata (RAG) per trasformare i chatbot in assistenti e avatar multilingue e dalle capacità espressive.

Presentazione dei risultati possibili grazie alla sintesi vocale e alla traduzione basate su IA

Fornisci chatbot IA con trascrizione, traduzione e voce multilingue all'avanguardia.

Vantaggi

Scopri i vantaggi di NVIDIA Riva

Trascrizioni multilingue accurate e voci espressive

Ottieni un'elevata precisione di trascrizione e traduzione multilingue e fornisci voci femminili e maschili pronte all'uso, espressive e professionali con modelli all'avanguardia pre-addestrati su migliaia di ore di audio sui supercomputer NVIDIA.

Completamente personalizzabile

Personalizza le pipeline ASR per diverse lingue, accenti, domini, vocabolari e contesti per la massima precisione possibile per il tuo caso d'uso e le pipeline TTS per la voce e il tono del brand desiderati.

Implementazioni flessibili

Offri esperienze coerenti a centinaia di migliaia di utenti simultanei con prestazioni di inferenza superiori rispetto alla tecnologia esistente e implementa ovunque: nei data center, sul luogo, nel cloud, nell'edge o nei dispositivi integrati.

IA di livello aziendale

Accelera lo sviluppo e l'implementazione di applicazioni IA multilingue e vocali aziendali con NVIDIA AI Enterprise, una piattaforma software end-to-end cloud-nativa per l'IA generativa sicura e stabile di livello aziendale.

NVIDIA Riva NIM è disponibile per il download

I nuovi microservizi ASR, TTS e NMT sono ora disponibili. Sono progettati per fornire un'inferenza IA ottimizzata per l'IA per parlato e traduzione. Questo include i modelli Parakeet che offrono precisione e prestazioni ASR per le impostazioni di registrazione.

Casi d'uso

Casi d'uso Come viene utilizzato Riva

Scopri come i leader del settore guidano l'innovazione con Riva.

Assistenti Domande e risposte

Le aziende stanno implementando assistenti Domande e risposte per rispondere automaticamente alle domande di milioni di clienti e dipendenti 24 ore su 24. Con i microservizi IA vocali e di traduzione di Riva, questi assistenti forniscono risposte utili e naturali in ogni momento della conversazione, indipendentemente dal rumore di fondo, la scarsa qualità del suono e i diversi dialetti e accenti dei parlanti.

Agent Assists

I consumatori si aspettano che gli agenti del call center risolvano i loro problemi in modo rapido ed efficiente. Per soddisfare queste aspettative e offrire la migliore esperienza possibile per clienti e agenti, le aziende di tutti i settori stanno implementando la tecnologia agent-assist basata sull’IA vocale e di traduzione Riva.

Avatar digitali e Brand ambassador

Per migliorare le esperienze del servizio clienti e costruire relazioni solide con i propri clienti, le aziende stanno costruendo avatar con una voce del brand riconoscibile. Con Riva possono creare una voce unica, di alta qualità e personalizzata con soli tre secondi di dati vocali.

Trascrizione in videoconferenza

Viste le centinaia di milioni di riunioni che si svolgono online ogni giorno, la videoconferenza è diventata uno strumento indispensabile per le aziende. Attraverso la trascrizione in tempo reale di Riva, le applicazioni di videoconferenza raggiungono una precisione impressionante nelle didascalie e nel riassunto delle riunioni, adattandosi a utenti con accenti da tutto il mondo e diversi vocabolari specifici per dominio.

Traduzione

Nell'economia globale, le aziende operano in diversi paesi e servono clienti con background linguistici e culturali diversi. Questa diversità linguistica globale pone una sfida unica, poiché assumere madrelingua e formare i dipendenti in più lingue non è scalabile, conveniente o efficiente. Riva Translation consente una comunicazione accurata ed efficiente, facilitando interazioni globali fluide.

Robot di servizio

I robot di servizio sono sempre più presenti negli ospedali, negli aeroporti e nei negozi al dettaglio di tutto il mondo. Aiutano i lavoratori in prima linea gestendo compiti ripetitivi quotidiani nei ristoranti e negli stabilimenti produttivi, assistono i clienti nel localizzare gli articoli nei negozi e supportano medici e infermieri nella cura dei pazienti. Con Riva, è facile aggiungere l'IA vocale e di traduzione ai robot di servizio.

Opzioni per iniziare

Come iniziare con NVIDIA Riva

Utilizza gli strumenti e le tecnologie giuste per creare e distribuire applicazioni di IA vocale e di traduzione completamente personalizzabili e multilingue.

Prova

Scopri Riva attraverso un portale basato sull'interfaccia utente per esplorare e creare prototipi con endpoint gestiti da NVIDIA, disponibile gratuitamente tramite il catalogo API di NVIDIA.

Prova

Accedi all'infrastruttura NVIDIA e ai laboratori pratici guidati che includono istruzioni ed esempi dettagliati, disponibili gratuitamente su NVIDIA LaunchPad.

Implementa

Ottieni una licenza aziendale gratuita per provare NVIDIA AI Enterprise per 90 giorni utilizzando l'infrastruttura esistente.

Storie dei clienti

Come i leader del settore guidano l'innovazione con Riva

Telecomunicazioni

IA vocale per l'eccellenza del servizio clienti

Cliente: T-Mobile

Prodotti: NVIDIA Riva, sistemi certificati NVIDIA

Tecnologie: NVIDIA Data Center GPU, NVIDIA NeMo, NVIDIA Riva

Telecomunicazioni

IA vocale di prim'ordine per la migliore esperienza di videoconferenza

Cliente: RingCentral

Prodotti: NVIDIA DGX, NVIDIA Riva

Tecnologie: NVIDIA Data Center GPU, NVIDIA NeMo, NVIDIA Riva, NVIDIA Triton Inference Server

Academia / Higher Education

Automatizzazione del riconoscimento della lingua araba parlata in tempo reale

Cliente: Tarteel.ai

Prodotti: : NVIDIA Riva, sistemi certificati NVIDIA

Tecnologie: NVIDIA NeMo, NVIDIA Riva, NVIDIA Data Center GPU

Utilizzatori

Principali clienti in tutti i settori

Risorse

Le ultime novità su NVIDIA Riva

Prova Riva su NVIDIA LaunchPad

Hai un progetto di IA vocale esistente? Candidati per sperimentare e prototipare le tue soluzioni basate sulla conversazione con competenze vocali nello stack software Riva ad alte prestazioni e pronto per l'implementazione.

Inizia con ASR personalizzato ad alta precisione

Impara a creare, addestrare, perfezionare e distribuire un servizio ASR accelerato da GPU con Riva che include funzionalità personalizzate

Parla ai tuoi dati nella tua lingua madre

Unisciti agli esperti di IA per imparare a creare, perfezionare e distribuire IA vocale e di traduzione multilingue pronta per la produzione in applicazioni basate su LLM, consentendo ai tuoi chatbot di parlare ai tuoi clienti nelle loro lingue native.

Utilizzo dell'IA vocale per trascrizione, traduzione e voce

Crea applicazioni di IA vocale di prim'odine, completamente personalizzabili, come assistenti virtuali intelligenti, servizi di trascrizione audio e avatar digitali.

Reinventa le esperienze di call center con NVIDIA Riva

Generando una trascrizione accurata delle interazioni con i clienti in tempo reale, Riva consente all’IA di fornire informazioni contestuali, misurare il sentimento e suggerire l’azione migliore a un agente, garantendo un’esperienza personalizzata eccezionale.

Cane robot porta gli snack in tutta la città

Guarda come Spot utilizza l'IA vocale per ordinare snack in tutta la città senza connessione internet. Invece di caricare i comandi vocali nel cloud ed elaborarli sul server, Spot elabora tutto localmente per garantire prestazioni e consegne efficienti e senza interruzioni.

Prossimi passi

Vuoi iniziare?

Utilizza gli strumenti e le tecnologie giuste per creare e distribuire applicazioni di IA completamente personalizzabili, multilingue, vocali e di traduzione.

Per gli sviluppatori

Esplora tutto ciò che ti serve per iniziare a sviluppare con NVIDIA Riva, tra cui la documentazione più recente, i tutorial, i blog tecnici e altro ancora.

Contattaci

Parla con uno specialista del prodotto NVIDIA per sapere come passare dal progetto pilota alla produzione con la sicurezza, la stabilità delle API e il supporto di NVIDIA AI Enterprise.

AI2Labs

Nel 2021, AI2Labs è partita da Yoozoo Games come startup tecnologica locale a Singapore. AI2Labs innova, sperimenta e sviluppa prodotti e applicazioni IA, consentendo processi efficienti e migliorando la sostenibilità e i risultati aziendali.

AI2Labs ha integrato Riva nell'API di riconoscimento vocale Speakr, l'IA vocale specifica per dominio, per adattarsi alle complessità delle specificità vocali e aziendali asiatiche e ottenere traduzioni in inglese di Singapore accurate e all'avanguardia.

 

Avaya

Avaya è specializzata in soluzioni di comunicazione cloud e collaborazione workstream, fornisce comunicazioni unificate, centro contatti, piattaforma di comunicazione as a service (CPaaS) e servizi con la piattaforma OneCloud.

Avaya integra il motore speech-to-text di NVIDIA Riva per didascalie in tempo reale su larga scala. Riva consente una migliore qualità di trascrizione, un tasso di errore per parola più basso e una distribuzione conveniente.

 

C-DAC

For over 10 years, the Applied AI Group at C-DAC in Pune, India, has focused on research and development of speech technology. They’ve successfully created a cutting-edge speech-to-text (STT) system for Indic languages such as Hindiand Marathi. The group continues to advance their work by exploring AI-enabled, open-source deep learning frameworks, libraries, and tools for creating STT and speech-enabled applications for other Indic and low-resource languages. Experiments were conducted using various neural network architectures and topologies from NVIDIA’s open-source NeMo framework, with Citrinet and Conformer-CTC network topologies proving to be effective in building and training neural acoustic models for speech recognition. These models were trained on single- and multi-node Param Siddhi AI systems, optimizing training time and performance. Finally, the models were deployed for real-time and batch-mode inference using the Riva GPU-accelerated production pipeline.

NCS

NCS, una filiale di Singtel Group, è una società leader di servizi tecnologici in Asia Pacifico. Collabora con governi e imprese per far crescere le comunità attraverso la tecnologia. Combinando l'esperienza e le competenze del suo team di 12.000 persone, in 61 specializzazioni, NCS offre servizi tecnologici differenziati e completi ai clienti con le funzionalità NEXT in ambito digitale, dati, cloud e piattaforme, nonché soluzioni essenziali per applicazioni, infrastrutture, ingegneria e sicurezza informatica. NCS crede anche nella creazione di un solido ecosistema di partner con i principali player tecnologici, gli istituti di ricerca e le start-up per supportare l'innovazione aperta e la creazione condivisa. 

NCS usa NVIDIA Riva TTS in Breeze, l'app di assistenza al conducente, per la navigazione con guida vocale, gli aggiornamenti sul traffico e sulle condizioni stradali in tempo reale, le tariffe dei parcheggi in tempo reale, i prezzi delle tratte autostradali e gli orari di funzionamento dei caselli elettronici, per aiutare i conducenti di Singapore a sperimentare percorsi di guida fluidi.

Scopri di più.

breeze.com.sg/

www.ncs.co

Customer Story

RingCentral

RingCentral, un fornitore leader di soluzioni globali di comunicazione, collaborazione e contact center su cloud aziendale, serve milioni di utenti. La piattaforma RingCentral consente la collaborazione da qualsiasi luogo e dispositivo, migliorando l'efficienza aziendale e la soddisfazione dei clienti.

RingCentral usa NVIDIA Riva per la trascrizione delle videoconferenze per 200.000 utenti simultanei sulla sua piattaforma.

Scopri di più.

www.ringcentral.com

Customer Story

GTC Session

Snap

Snap è un'azienda di fotocamere e social media che consente la creazione di messaggi multimediali con filtri ed effetti. Per creare esperienze più interattive, gli utenti di Snapchat usano Lenses, una funzionalità che aggiunge effetti in tempo reale agli scatti, oltre 6 miliardi di volte al giorno. 

Il servizio di IA vocale ottimizzato per rumore e linguaggio di NVIDIA Riva è integrato in Snap AR Lens Studio e consente a creativi, artisti e sviluppatori, di creare esperienze accattivanti in AR (realtà aumentata).

T-Mobile

T-Mobile, un importante operatore telefonico, offre una rete LTE 4G avanzata e una rete 5G trasformativa per la migliore esperienza clienti. Per supportare gli operatori del contact center, T-Mobile implementa Expert Assist. Questo software basato su IA usa NVIDIA Riva per trascrivere in tempo reale le conversazioni dei clienti che alimentano i generatori di consigli e assistono migliaia di operatori.

Con Riva, T-Mobile calibra i modelli di riconoscimento vocale automatico su set di dati personalizzati e interpreta accuratamente il linguaggio dei clienti in ambienti rumorosi.

Scopri di più.

www.t-mobile.com

Customer Story

GTC Session

Building Speech AI Applications

Explore how to get started with integrating and deploying Riva ASR and TTS models in production with high-performance inference and minimal effort.

An Introduction to NVIDIA Riva

Learn about Riva’s architecture, key features, and components for building speech and translation AI services.

NVIDIA Parlays Win in Voice Challenge

Read how a team of NVIDIANs won the LIMMITS ’24 challenge, which asked contestants to recreate in real time a speaker’s voice in English or any of six languages spoken in India with the appropriate accent.