語音和翻譯人工智慧
為大型語言模型和檢索增強生成應用程式打造並部署完全可自訂的多語言語音和翻譯人工智慧。
影片 | 解決方案簡介 | 適用於開發人員
NVIDIA® Riva 是一組 GPU 加速的多語言語音和翻譯微服務,可打造完全可自訂的即時對話式人工智慧流程。Riva 包含自動語音辨識 (ASR)、 文字轉語音 (TTS)和神經機器翻譯 (NMT),可部署在所有雲端、資料中心、邊緣端或嵌入式裝置上。透過 Riva,組織可以利用大型語言模型 (LLM) 和檢索增強生成 (RAG)新增語音和翻譯功能,將聊天機器人轉變成多語言助理和虛擬角色。
為人工智慧聊天機器人提供最先進的多語言轉譯、翻譯和語音功能。
透過在 NVIDIA 超級電腦上以數千小時音訊預先訓練出的最先進的模型,實現多語言翻譯的高準確度轉譯,並部署立即可用、富有表現力且專業的女性和男性聲音。
針對不同語言、口音、領域、詞彙和上下文情境,跨ASR 管道進行自行訂製,以提供最佳精準度,同時在 TTS 流程中可自行定義聲音及語調,以達到您所需的效果。
可處理成千上萬個輸入來源,提供高度一致體驗,與現有技術相比,具有更高的推理效能,並且可以根據您選擇的部署,包含在資料中心、本機、雲端、邊緣端或嵌入式裝置中進行部署。
NVIDIA AI Enterprise 是一款端對端的雲端原生軟體平台,可提供安全穩定的企業級生成式人工智慧,加速開發和部署生產級、多語言、支援語音的人工智慧應用程式。
體驗現已推出的全新 ASR、TTS 和 NMT 微服務,旨在為語音和翻譯 AI 提供優化的 AI 推理。這包括提供記錄設定 ASR 準確性和性能的 Parakeet 模型。
瞭解業界領導者如何運用 Riva 推動創新。
許多公司都開始部署問答助理,以全天候自動處理數百萬客戶和員工的查詢。有了 Riva 的語音和翻譯人工智慧微服務,可克服背景雜音、音質不佳,以及說話者各自不同的方言和口音等問題,在對話的每個階段提供實用且自然的回應。
消費者會預期客服中心人員能快速且有效率地解決他們的問題。為了達到消費者的期待,並為顧客與客服人員盡可能提供最佳體驗,企業已開始採用由 Riva 語音和翻譯人工智慧支援的客服人員輔助技術。
為了提升客戶服務體驗,並與客戶建立穩固的關係,許多企業都開始建立具有可辨識品牌語音的虛擬角色。有了 Riva,只需要三秒的語音資料,就能創造出獨特、高品質且個人化的語音。
每天都有數億場線上會議舉行,視訊會議已成為企業不可或缺的工具。透過 Riva 的即時轉譯功能,視訊會議應用程式可在即時字幕和會議摘要方面達到驚人的準確度,配合來自世界各地的使用者口音和各種特定領域詞彙。
在全球經濟中,企業經營版圖橫跨國界,並會為具有多元語言和文化背景的客戶提供服務。全球語言的多樣性便帶來了很特殊的挑戰,因為僱用以多種語言為母語的員工和訓練員工的可擴充性、成本效益或效率皆差強人意。Riva 翻譯可達到準確且有效的溝通,促進全球互動順暢進行。
服務機器人在世界各地的醫院、機場和零售商店都越來越常見。這些機器人會協助第一線員工處理餐廳和製造設施中的日常重複性工作、協助客戶在商店中找到商品,並支援醫生和護理師照護患者的工作。有了 Riva,就能輕鬆將語音和翻譯人工智慧應用在服務機器人上。
使用正確的工具和技術,打造和部署完全可自訂的多語言語音和翻譯人工智慧應用程式。
透過具使用者介面的入口網站探索 Riva,並使用 NVIDIA 管理的端點製作原型,您可透過 NVIDIA 的 API 目錄免費使用這類端點。
可在 NVIDIA LaunchPad 上免費取得 NVIDIA 託管的基礎架構,以及包含逐步說明和範例的引導式實作實驗室。
取得免費授權,使用現有的基礎架構,在生產環境中試用 NVIDIA AI Enterprise 90 天。
客戶: T-Mobile
產品: NVIDIA Riva、NVIDIA 認證系統
技術: NVIDIA 資料中心 GPU、NVIDIA NeMo、NVIDIA Riva
客戶: RingCentral
產品: NVIDIA DGX, NVIDIA Riva
技術: NVIDIA 資料中心 GPU、NVIDIA NeMo、NVIDIA Riva、NVIDIA Triton 推論伺服器
客戶: Tarteel.ai
技術: NVIDIA NeMo、NVIDIA Riva、NVIDIA 資料中心 GPU
手上有進行中的語音人工智慧專案嗎?申請使用高效能 Riva 軟體堆疊的語音技能,獲得實作測試體驗並建立對話解決方案的原型,並可立即部署。
學習如何藉由包含自訂功能的 Riva 來建立、訓練、微調和部署一個 GPU 加速的服務。
與人工智慧專家一同學習如何在 LLM 應用程式上建立、微調和部署可量產的多語言語音和翻譯人工智慧,讓聊天機器人能以自然語言與客戶對話。
打造完全可自訂的世界級語音人工智慧應用程式,例如智慧虛擬助理、音訊轉譯服務和數位虛擬角色。
Riva 可即時產生準確的客戶互動逐字稿,讓人工智慧能夠提供情境式見解、評估使用者情緒,並向客服人員推薦下一個最佳行動,確保提供絕佳的個人化體驗。
觀看機器狗點點如何使用語音人工智慧,在沒有網際網路的情況下,到鎮上另一頭幫主人取餐。點點不會將語音命令上傳到雲端並在伺服器上處理,而是在本機上處理所有內容,藉此達到流暢、高效率的效能和交付品質。
在此探索開始使用 NVIDIA Riva 開發所需的一切,包含最新的說明文件、教學、技術部落格等。
與 NVIDIA 產品專家討論,瞭解如何藉由 NVIDIA AI Enterprise 帶來的安全性、API 穩定性和支援,從試用邁入生產階段。
2021年,AI2Labs 自 Yoozoo Games 中獨立成為新加坡當地的新創科技公司。AI2Labs 致力於創新、實驗並開發 AI 產品和相關應用,實現高效流程,提升營收與永續發展。
AI2Labs 將 Riva 集成到 Speakr 領域特定語音 AI 語音識別 API 中,以適應亞洲語音和商業領域的複雜,打造新加坡式英文翻譯的高準確度。
Avaya 專注於雲端通訊和工作流程協作解決方案,透過 OneCloud 平台提供通訊、客服中心、通訊平台即服務(CPaaS)等服務。
Avaya 運用 NVIDIA Riva 語音轉文字引擎,提供大規模即時字幕。 Riva 可提供更優異的轉錄質量、更低的文字錯誤率與更具經濟效益的選擇。
十多年來,位於印度浦那的 C-DAC Applied AI 團隊長期專注於語音技術的研發。他們成功地為印度語和馬拉地語等印度語言創建一個頂尖的語音轉文字 (STT) 系統。該小組透過 AI 支援的開源深度學習框架、資料庫和工具,為其他印度語和低資源語言創建 STT 和支持語音的應用程式,不斷拓展其工作。並使用 NVIDIA 的開源 NeMo 框架中的各種神經網路架構和拓撲進行了實驗,其中 Citrinet 和 Conformer-CTC 網路拓撲在構建和訓練語音識別神經聲學模型方面表現出色。這些模型在單節點和多節點 Param Siddhi AI 系統上進行訓練,優化訓練時間和效能。最終,這些模型在 Riva GPU 加速的生產管道上進行即時及分批推論的部署。
NCS 是新加坡電信集團的子公司,可謂亞太地區中具有領先技術服務公司,與當地政府和企業合作,透過技術推動社區發展。 憑藉著 NCS 擁有 61 個專業領域的 12,000 多名強大團隊的經驗和專業知識,在數位化、數據、雲端和平台方面的 NEXT 能力以及應用程式、基礎設施方面的核心產品,為客戶提供極具差異化的端到端技術服務、工程和網路安全。 NCS 亦致力於與業界領先的技術公司、研究機構和新創企業建立強大的合作夥伴生態系統,支持開放式創新及共創。
NCS 在 Breeze(司機配套應用程式)中使用 NVIDIA Riva TTS,提供語音引導導航、即時交通和路況更新、即時停車費率以及通路費定價費率和營運時間,幫助新加坡司機體驗順暢無礙的駕駛旅程。
breeze.com.sg/
www.ncs.co
客戶故事
RingCentral 是全球領先的企業雲端通訊、協作和客服中心解決方案供應商,為數百萬顧客提供相關服務。RingCentral 平台可隨時隨地、無設備限制地進行協作,進而提高業務效率和客戶滿意度。
RingCentral 透過 NVIDIA Riva 可為其平台上的 200,000 個用戶同時進行視訊會議轉錄。
www.ringcentral.com
通用技術委員會會議
Snap 是一家相機和社交媒體公司,可通過濾鏡和特效創建多媒體訊息。為創建更具互動性的體驗,Snapchat 用戶每天玩轉 Lenses 功能超過 60 億次,在限時動態中增添即時效果。
NVIDIA Riva 的消噪及語音優化的語音 AI 服務已整合至 Snap AR Lens Studio 中,讓藝術家和開發人員等創作者可建立引人入勝的擴增實境(AR)體驗。
T-Mobile 是一家實力強勁的非運營商,提供先進的 4G LTE 和變革性的 5G 網絡,以提供最佳的客戶體驗。為了增強聯絡中心座席的能力,T-Mobile 實施了 Expert Assist。這款基於 AI 的軟件使用 NVIDIA Riva 轉錄實時客戶對話,為推薦人員提供信息並為數千名客服人員提供幫助。
T-Mobile 是一家實力強勁的電信商,提供先進的 4G LTE 和具有變革性的 5G 網路,以提供最佳客戶體驗。為了賦予客服中心代理者更多能力,T-Mobile 推出 Expert Assist。此款基於 AI 的軟體使用 NVIDIA Riva 進行即時轉錄客戶對話,為數千名客服人員提供幫助。
藉由 Riva 解決方案,T-Mobile 在自行定義資料集上可微調自動語音識別模型,並在嘈雜的環境中準確解讀客戶術語。
www.t-mobile.com
GTC 講座
我們將回答您的問題並幫助滿足您組織的需求。
NVIDIA 隱私權政策