Sprach- und Übersetzungs-KI
Entwickeln und implementieren Sie eine vollständig anpassbare mehrsprachige Sprach- und Übersetzungs-KI für Ihre auf großen Sprachmodellen und Retrieval-Augmented Generation basierenden Anwendungen.
Video | Lösungsübersicht | Für Entwickler
NVIDIA® Riva umfasst eine Reihe von GPU-beschleunigten mehrsprachigen Sprach- und Übersetzungs-Microservices für die Entwicklung vollständig anpassbarer Echtzeit-KI-Gesprächs-KI-Pipelines. Riva beinhaltet automatische Spracherkennung (ASR), Text-to-Speech (TTS) sowie neuronale maschinelle Übersetzung (NMT) und kann in allen Clouds, in Rechenzentren, im Edge-Umfeld und in Embedded-Geräten eingesetzt werden. Mit Riva können Unternehmen ihren Lösungen Sprach- und Übersetzungs-Schnittstellen mit großen Sprachmodellen (LLMs) und Retrieval-Augmented Generation (RAG) hinzufügen, um Chatbots in ansprechende, ausdrucksstarke mehrsprachige Assistenten und Avatare zu verwandeln.
Bereitstellen von KI-Chatbots mit modernster mehrsprachiger Transkription, Übersetzung und Spracheingabe.
Mit State-of-the-Art-Modellen, die mit Tausenden Stunden Audiomaterial auf NVIDIA-Supercomputern vortrainiert wurden, erhalten Sie hohe mehrsprachige Transkriptions- und Übersetzungsgenauigkeit und sofort einsatzbereite ausdrucksstarke, professionelle weibliche und männliche Stimmen.
Passen Sie ASR-Pipelines für verschiedene Sprachen, Akzente, Fachgebiete sowie unterschiedliches Vokabular und den jeweiligen Kontext an, um die bestmögliche Genauigkeit für Ihren Anwendungsfall und die TTS-Pipelines für die gewünschte Markenstimme und Intonation zu erreichen.
Bieten Sie Hunderttausenden gleichzeitiger Benutzer ein konsistentes Erlebnis mit einer höheren Inferenzleistung als mit bisheriger Technologie, und stellen Sie die Lösung überall bereit – in Rechenzentren, hausintern, in der Cloud, im Edge-Umfeld oder in Embedded-Systemen.
Beschleunigen Sie die Entwicklung und Bereitstellung von mehrsprachigen, sprachfähigen KI-Anwendungen für den Produktivbetrieb mit NVIDIA AI Enterprise, einer durchgängigen, cloudbasierten Softwareplattform für sichere und stabile generative KI auf Unternehmensniveau.
Erleben Sie neue ASR-, TTS- und NMT-Mikroservices, die jetzt verfügbar sind – sie wurden entwickelt, um optimierte KI-Inferenzen für Sprach- und Übersetzungs-KI zu bieten. Dazu gehören Parakeet-Modelle, die die Aufnahmeeinstellung ASR-Genauigkeit und -Leistung bieten.
Erfahren Sie, wie Branchenführer Innovationen mit Riva vorantreiben.
Unternehmen setzen Frage- und Antwort-Assistenten (Q&A-Assistenten) ein, um die Anfragen von Millionen Kunden und Mitarbeitenden rund um die Uhr automatisch zu beantworten. Mit den Sprach- und Übersetzungs-KI-Microservices von Riva bieten diese Assistenten trotz Hintergrundgeräuschen, schlechter Klangqualität und vielfältiger Sprecherdialekte und -akzente hilfreiche und natürliche Antworten in jeder Gesprächsphase.
Kunden erwarten von Mitarbeitenden im Kontaktcenter, dass sie ihre Probleme schnell und effizient lösen. Um diesen Erwartungen gerecht zu werden und das bestmögliche Benutzererlebnis für Kunden und Agenten zu bieten, implementieren Unternehmen aus verschiedenen Branchen Assistenztechnik für Agenten, die von Riva Sprach- und Übersetzungs-KI unterstützt wird.
Um die Kundenserviceerfahrung zu verbessern und ihre Kundenbeziehungen zu verstärken, entwickeln Unternehmen Avatare mit wiedererkennbarer Markenstimme. Mit Riva können sie mit nur drei Sekunden Sprachdaten eine unverwechselbare, hochwertige, personalisierte Stimme erzeugen.
Angesichts von hunderten Millionen Online-Meetings, die täglich stattfinden, sind Videokonferenzen zu einem unverzichtbaren Tool für Unternehmen geworden. Durch die Echtzeit-Transkription von Riva erreichen Videokonferenzanwendungen beeindruckende Genauigkeit für Live-Untertitel und Zusammenfassungen von Meetings, bei denen Sprachvarianten aus aller Welt und vielfältiges fachspezifisches Vokabular Berücksichtigung finden.
In der globalen Wirtschaft sind Unternehmen länderübergreifend tätig und bedienen Kunden mit unterschiedlichem sprachlichem und kulturellem Hintergrund. Diese Vielfalt von Sprachen in aller Welt stellt eine besondere Herausforderung dar, da die Einstellung von Muttersprachlern und die Schulung von Mitarbeitenden in mehreren Sprachen weder skalierbar noch kostengünstig oder effizient ist. Die Übersetzung mit Riva ermöglicht eine akkurate, effektive Kommunikation und reibungslose globale Interaktionen.
Serviceroboter finden sich weltweit zunehmend in Krankenhäusern, Flughäfen und Einzelhandelsgeschäften. Sie unterstützen nicht stationär am Arbeitsplatz Beschäftigte bei der Bewältigung alltäglicher, sich wiederholender Aufgaben in Restaurants und Produktionsanlagen, helfen Kunden bei der Suche nach Artikeln in Geschäften und unterstützen Ärzte und Pflegepersonal bei der Patientenversorgung. Mit Riva ist es einfach, Serviceroboter zusätzlich mit Sprach- und Übersetzungs-KI auszurüsten.
Nutzen Sie die richtigen Tools und Technologien, um vollständig anpassbare, mehrsprachige Sprach- und Übersetzungs-KI-Anwendungen zu entwickeln und bereitzustellen.
Erleben Sie Riva über ein UI-basiertes Portal zum Ausprobieren und Prototypisieren mit den von NVIDIA verwalteten Endpunkten, das kostenlos über den NVIDIA API-Katalog verfügbar ist.
Nutzen Sie die von NVIDIA gehostete Infrastruktur und geleitete praktische Übungsumgebungen mit schrittweisen Anleitungen und Beispielen, die kostenlos auf NVIDIA LaunchPad verfügbar sind.
Holen Sie sich eine kostenlose Lizenz, mit der Sie NVIDIA AI Enterprise 90 Tage lang produktiv in Ihrer bestehenden Infrastruktur testen können.
Kunde: T-Mobile
Produkte: NVIDIA Riva, NVIDIA-zertifizierte Systeme
Technologie: NVIDIA Rechenzentrum-GPUs, NVIDIA NeMo, NVIDIA Riva
Kunde: RingCentral
Produkte: NVIDIA DGX, NVIDIA Riva
Technologie: NVIDIA GPUs für Rechenzentren, NVIDIA NeMo, NVIDIA Riva, NVIDIA Triton Inference Server
Kunde: Tarteel.ai
Technologie: NVIDIA NeMo, NVIDIA Riva, NVIDIA GPUs für Rechenzentren
Haben Sie bereits ein Sprach-KI-Projekt? Bewerben Sie sich, um beim Testen und Entwickeln von Prototypen Ihrer gesprächsbasierten Lösungen mit Sprachfähigkeiten praktische Erfahrung mit dem hochleistungsfähigen Riva-Softwarestack zu sammeln, der sofort bereitgestellt werden kann.
Lernen Sie, wie Sie mit Riva einen GPU-beschleunigten ASR-Service mit angepassten Funktionseigenschaften einrichten, trainieren, optimieren und bereitstellen können.
Erfahren Sie mit unseren KI-Experten, wie Sie eine für den Produktivbetrieb bereite, mehrsprachige Sprach- und Übersetzungs-KI für LLM-basierte Anwendungen entwickeln, optimieren und bereitstellen, damit Ihre Chatbots mit Ihren Kunden in natürlicher Sprache sprechen.
Entwickeln Sie vollständig anpassbare hochwertige Sprach-KI-Anwendungen wie intelligente virtuelle Assistenten, Audiotranskriptionsdienste und digitale Avatare.
Sehen Sie, wie Spot Sprach-KI nutzt, um ohne Internetverbindung in der Stadt Snacks zu bestellen. Anstatt Sprachbefehle in die Cloud hochzuladen und auf dem Server zu verarbeiten, verarbeitet Spot alles lokal und ermöglicht so eine nahtlose, effiziente Funktion und Lieferung.
Nutzen Sie die richtigen Tools und Technologien, um vollständig anpassbare, mehrsprachige Sprach- und Übersetzungs-KI-Anwendungen zu erstellen und bereitzustellen.
Informieren Sie sich über alles, was Sie für die Entwicklung mit NVIDIA Riva brauchen, darunter aktuelle Dokumentation, Tutorials, technische Blogs und mehr.
Sprechen Sie mit einem NVIDIA-Produktspezialisten über den Wechsel vom Pilot- zum Produktivbetrieb mit der Sicherheit, API-Stabilität und Unterstützung von NVIDIA AI Enterprise.
AI2Labs wurde 2021 in Singapur von Yoozoo Games als lokales Tech-Start-up gegründet. AI2Labs innoviert, experimentiert und entwickelt KI-Produkte und KI-Anwendungen, die effiziente Prozesse ermöglichen und so die Nachhaltigkeit und Geschäftsergebnisse verbessern.
AI2Labs hat Riva in seine Spracherkennungs-API Speakr integriert – eine bereichsspezifische Sprach-KI –, um die Feinheiten asiatischer Sprach- und Geschäftsbereiche abzubilden, und hat damit eine hochmoderne Genauigkeit der Singlisch-Übersetzung erzielt.
Avaya ist auf Lösungen für Cloud-Kommunikation und Workstream Collaboration spezialisiert und bietet mit seiner OneCloud-Plattform Unified Communications, Contact Center, Communications Platform as a Service (CPaaS) und Services.
Avaya hat die NVIDIA Riva Speech-to-Text-Engine für die Echtzeituntertitelung im großen Maßstab integriert. Riva ermöglicht eine bessere Transkriptionsqualität, eine geringere Wortfehlerrate und eine wirtschaftliche Bereitstellung.
For over 10 years, the Applied AI Group at C-DAC in Pune, India, has focused on research and development of speech technology. They’ve successfully created a cutting-edge speech-to-text (STT) system for Indic languages such as Hindiand Marathi. The group continues to advance their work by exploring AI-enabled, open-source deep learning frameworks, libraries, and tools for creating STT and speech-enabled applications for other Indic and low-resource languages. Experiments were conducted using various neural network architectures and topologies from NVIDIA’s open-source NeMo framework, with Citrinet and Conformer-CTC network topologies proving to be effective in building and training neural acoustic models for speech recognition. These models were trained on single- and multi-node Param Siddhi AI systems, optimizing training time and performance. Finally, the models were deployed for real-time and batch-mode inference using the Riva GPU-accelerated production pipeline.
NCS ist eine Tochtergesellschaft der Singtel Group und ein führender Technologiedienstleister im asiatisch-pazifischen Raum. Das Unternehmen arbeitet mit Regierungen und Unternehmen zusammen, um Kommunen durch Technologie voranzubringen. Durch die Kombination der Erfahrung und des Fachwissens seines 12.000 Mitarbeiter umfassenden Teams mit 61 Spezialisierungen bietet NCS seinen Kunden differenzierte und umfassende Technologiedienste mit seinen NEXT-Fähigkeiten in den Bereichen Digital, Daten, Cloud und Plattformen sowie zentrale Angebote in den Bereichen Anwendung und Infrastruktur, Technik und Cybersicherheit. NCS setzt außerdem auf ein starkes Partnerökosystem mit führenden Technologieakteuren, Forschungseinrichtungen und Start-ups, um offene Innovationen und Co-Creation zu unterstützen.
NCS nutzt NVIDIA Riva TTS in Breeze – der Begleit-App für den Fahrer – für die sprachgeführte Navigation, Live-Updates zu Verkehr und Straßenzustand, Parktarife in Echtzeit sowie elektronische Straßenbenutzungsgebühren und Betriebszeiten, um Fahrern in Singapur eine störungsfreie Fahrt zu ermöglichen.
breeze.com.sg/
www.ncs.co
Customer Story
RingCentral ist ein führender Anbieter globaler Unternehmenslösungen für Cloud-Kommunikation, Zusammenarbeit und Contact Center, der Millionen von Benutzern betreut. Die RingCentral-Plattform ermöglicht die Zusammenarbeit von jedem Ort aus und mit jedem Gerät und verbessert die geschäftliche Effizienz und die Zufriedenheit der Kunden.
RingCentral nutzt NVIDIA Riva für die Transkription von Videokonferenzen für 200.000 gleichzeitige Benutzer seiner Plattform.
www.ringcentral.com
GTC Session
Snap ist ein Kamera- und Social-Media-Unternehmen, das die Erstellung von Multimedia-Nachrichten mit Filtern und Effekten ermöglicht. Um interaktivere Erlebnisse zu erschaffen, spielen Snapchat-Benutzer täglich über 6 Milliarden mal mit Lenses – einer Funktion, die Echtzeiteffekte zu Schnappschüssen hinzufügt.
Der für Geräusche und Sprache optimierte Sprach-KI-Dienst Riva von NVIDIA ist in Snap AR Lens Studio integriert, mit dem Ersteller – Künstler und Entwickler – packende AR-Erlebnisse (Augmented Reality) erschaffen können.
T-Mobile ist Anbieter von superschnellem Mobilfunk und bietet ein fortschrittliches 4G LTE- sowie ein transformatives 5G-Netz für ein bestmögliches Kundenerlebnis. T-Mobile implementiert Expert Assist, um Contact-Center-Mitarbeitern die Arbeit zu erleichtern. Diese KI-basierte Software nutzt NVIDIA Riva, um Kundengespräche in Echtzeit zu transkribieren, die in Empfehlungssysteme eingespeist werden und tausende von Agenten unterstützen.
Mit Riva hat T-Mobile eine Feinabstimmung automatischer Spracherkennungsmodelle mit benutzerdefinierten Datensätzen durchgeführt und kann auch in lauten Umgebungen die Sprache der Kunden exakt interpretieren.
www.t-mobile.com
Wir beantworten Ihre Fragen und helfen Ihnen bei der Erfüllung der Anforderungen Ihrer Organisation.
NVIDIA-Datenschutzrichtlinie
Explore how to get started with integrating and deploying Riva ASR and TTS models in production with high-performance inference and minimal effort.
Learn about Riva’s architecture, key features, and components for building speech and translation AI services.
Read how a team of NVIDIANs won the LIMMITS ’24 challenge, which asked contestants to recreate in real time a speaker’s voice in English or any of six languages spoken in India with the appropriate accent.