음성 및 번역 AI
거대 언어 모델과 검색 증강 생성 기반 애플리케이션을 위해 완전히 맞춤화 가능한 다국어 음성 및 번역 AI를 구축 및 배포하세요.
영상 | 솔루션 개요 | 개발자용
NVIDIA® Riva는 완전히 맞춤화 가능한 실시간 대화형 AI 파이프라인을 구축하기 위한 GPU 가속 다국어 음성 및 번역 마이크로 서비스 세트입니다. Riva는 자동 음성 인식(ASR), 텍스트-음성 변환(TTS), 신경망 기계 번역(NMT)을 포함하며 모든 클라우드, 데이터센터, 엣지 또는 임베디드 디바이스에 배포할 수 있습니다. 조직은 Riva를 통해 거대 언어 모델(LLM) 및 검색 증강 생성(RAG)을 활용하여 음성 및 번역 인터페이스를 추가함으로써 챗봇을 매력적이고 표현력이 풍부한 다국어 어시스턴트 및 아바타로 만들 수 있습니다.
최첨단 다국어 전사, 번역, 음성을 통해 AI 챗봇을 제공합니다.
높은 다국어 전사 및 번역 정확도를 달성하고 NVIDIA 슈퍼컴퓨터에서 수천 시간의 오디오에 대해 사전 훈련된 최첨단 모델을 통해 표현력이 뛰어난 전문 여성 및 남성 목소리를 제공할 수 있습니다.
ASR 파이프라인 전반에서 다양한 언어, 억양, 분야, 어휘 및 맥락에 맞게 맞춤화하여 사용 사례에서 가능한 최고의 정확도를 달성하고, TTS 파이프라인 전반에서 원하는 브랜드 음성 및 억양을 맞춤화할 수 있습니다.
기존 기술보다 더 높은 추론 성능으로 수십만 명의 동시 사용자에게 일관된 경험을 제공하고 데이터센터, 온프레미스, 클라우드, 엣지 또는 임베디드 디바이스 등 어디에나 배포할 수 있습니다.
안전하고 안정적인 엔터프라이즈급 생성형 AI를 위한 엔드 투 엔드 클라우드 기반 소프트웨어 플랫폼인 NVIDIA AI Enterprise를 통해 프로덕션급, 다국어, 음성 지원 AI 애플리케이션의 개발 및 배포를 가속화하세요.
음성 및 번역 AI에 최적화된 AI 추론을 제공하도록 설계된 새로운 ASR, TTS 및 NMT 마이크로 서비스를 지금 바로 체험해 보세요. 여기에는 녹음 설정 ASR 정확도와 성능을 제공하는 Parakeet 모델이 포함됩니다
업계 리더들이 Riva를 통해 혁신을 주도하는 방법을 알아보세요.
기업들은 Q&A 어시스턴트를 배포하여 24시간 내내 수백만 명의 고객과 직원의 문의를 자동으로 해결하고 있습니다. Riva의 음성 및 번역 AI 마이크로 서비스를 통해 이러한 어시스턴트는 배경 노이즈, 낮은 음질, 다양한 화자 방언 및 억양에도 불구하고 대화의 모든 단계에서 유용하고 자연스러운 응답을 제공합니다.
소비자는 콜센터 상담원이 문제를 빠르고 효율적으로 해결해 주기를 기대합니다. 이러한 기대에 부응하고 가능한 한 최고의 고객 및 상담원 경험을 제공하기 위해 산업 전반의 엔터프라이즈는 Riva 음성 및 번역 AI를 기반으로 하는 상담원 지원 기술을 구현하고 있습니다.
고객 서비스 경험을 개선하고 고객과의 긴밀한 관계를 구축하기 위해 기업들은 인식 가능한 브랜드 음성으로 아바타를 구축하고 있습니다. Riva를 사용하면 단 3초의 음성 데이터로 고유한 고품질 맞춤형 음성을 생성할 수 있습니다.
매일 수억 건의 온라인 회의가 열리는 가운데, 화상 회의는 엔터프라이즈에 필수적인 도구가 되었습니다. 화상 회의 애플리케이션은 Riva의 실시간 전사 기능을 통해 실시간 자막 및 회의 요약에서 놀라운 정확도를 달성하여 전 세계의 억양과 다양한 영역별 어휘를 가진 사용자를 수용합니다.
글로벌 경제에서 기업들은 여러 국가에서 운영되며 다양한 언어 및 문화적 배경을 가진 고객에게 서비스를 제공합니다. 원어민을 고용하고 다국어로 직원을 교육하는 것은 확장 가능하지 않거나 비용 효율적이지 않거나 효과적이지 않기 때문에 글로벌 언어의 이러한 다양성은 고유한 문제를 제기합니다. Riva 번역은 정확하고 효과적인 커뮤니케이션을 지원하여 원활한 글로벌 상호 작용을 촉진합니다.
서비스 로봇은 전 세계 병원, 공항 및 소매점에서 점점 더 많이 사용되고 있습니다. 레스토랑과 제조 시설에서 매일 반복되는 작업을 처리하여 최전선 근로자를 지원하고, 고객이 매장에서 품목을 찾을 수 있도록 도우며, 환자를 돌보는 의사와 간호사를 지원합니다. Riva를 사용하면 음성 및 번역 AI를 서비스 로봇에 쉽게 추가할 수 있습니다.
적합한 도구 및 기술을 사용하여 완전히 맞춤화 가능한 다국어 음성 및 번역 AI 애플리케이션을 구축하고 배포하세요.
NVIDIA의 API 카탈로그를 통해 무료로 제공되는 NVIDIA 관리 엔드포인트로 탐색 및 프로토타입 제작을 위한 UI 기반 포털을 통해 Riva를 경험하세요.
NVIDIA LaunchPad에서 무료로 제공되는 단계별 지침과 예제가 포함된 NVIDIA 호스팅 인프라 및 가이드 핸즈온 랩에 액세스하세요.
기존 인프라를 사용하여 프로덕션 환경에서 90일 동안 NVIDIA AI Enterprise를 사용해 볼 수 있는 무료 라이선스를 받으세요.
고객: T-Mobile
제품: NVIDIA Riva, NVIDIA-Certified Systems
기술: NVIDIA 데이터센터 GPU, NVIDIA NeMo, NVIDIA Riva
고객: RingCentral
제품: NVIDIA DGX, NVIDIA Riva
기술: NVIDIA 데이터센터 GPU, NVIDIA NeMo, NVIDIA Riva, NVIDIA Triton Inference Server
고객: Tarteel.ai
기술: NVIDIA NeMo, NVIDIA Riva, NVIDIA 데이터센터 GPU
기존 음성 AI 프로젝트가 있으신가요? 지금 배포할 수 있는 고성능 Riva 소프트웨어 스택에서 음성 기술을 갖춘 대화 기반 솔루션을 테스트하고 프로토타입을 만드는 핸즈온 경험을 위해 신청하세요.
맞춤형 기능을 포함하는 Riva를 통해 GPU 가속 자동 음성 인식(ASR) 서비스를 구축, 훈련, 미세 조정, 배포하는 방법을 알아보세요.
AI 전문가와 함께 LLM 기반 애플리케이션에 프로덕션용 다국어 음성 및 번역 AI를 구축, 미세 조정 및 배포하여 챗봇이 사용자가 선택한 언어로 말하도록 지원하는 방법을 알아보세요.
지능형 가상 어시스턴트, 오디오 전사 서비스, 디지털 아바타 등 세계적 수준의 완전히 맞춤화 가능한 음성 AI 애플리케이션을 구축하세요.
Riva는 실시간으로 고객 상호 작용의 정확한 전사를 생성함으로써 AI가 상황에 맞는 인사이트를 제공하고, 감정을 측정하며, 상담원에게 차선책을 추천할 수 있도록 지원하여 뛰어난 맞춤형 경험을 보장합니다.
Watch as Spot은 인터넷 연결 없이도 음성 AI를 사용하여 도시 곳곳에서 간식을 주문합니다. Spot은 음성 명령을 클라우드에 업로드하고 서버에서 처리하는 대신 원활하고 효율적인 성능 및 전달을 위해 모든 것을 로컬로 처리합니다.
최신 문서, 튜토리얼, 기술 블로그 등 NVIDIA Riva로 개발을 시작하는 데 필요한 모든 것을 살펴보세요., and more.
NVIDIA AI Enterprise의 보안, API 안정성, 지원을 통해 파일럿에서 프로덕션 단계로 전환하는 과정에 대해 NVIDIA 제품 전문가와 상담하세요.
2021년 AI2Labs는 유주게임즈(Yoozoo Games)에서 싱가포르 현지 기술 스타트업으로 분사되었습니다. AI2Labs는 AI 제품과 애플리케이션을 혁신, 실험, 개발하여 효율적인 프로세스를 지원하고 지속 가능성과 비즈니스 성과를 개선합니다.
AI2Labs는 Riva를 도메인별 음성 AI인 Speakr 음성 인식 API에 통합하여 아시아 음성 및 비즈니스 도메인의 복잡성을 수용하고 최첨단 Singlish 번역 정확도를 달성했습니다.
Avaya는 OneCloud 플랫폼을 통해 통합 커뮤니케이션, 연락 센터, 서비스형 커뮤니케이션 플랫폼(CPaaS) 및 서비스를 제공하는 클라우드 커뮤니케이션 및 작업 흐름 협업 솔루션을 전문으로 합니다.
Avaya는 대규모 실시간 캡션을 위해 NVIDIA Riva 음성 텍스트 변환 엔진을 통합했습니다. Riva는 더 나은 전사 품질, 낮은 단어 오류율 및 경제적인 전달을 가능하게 합니다.
인도 푸네에 위치한 C-DAC의 Applied AI Group은 10년 넘게 음성 기술 연구 및 개발에 주력해 왔습니다. 그들은 힌디어와 마라티어와 같은 인도어를 위한 최첨단 음성 텍스트 변환(STT) 시스템을 성공적으로 만들었습니다. 이 그룹은 다른 인도어 및 저자원 언어용 STT 및 음성 지원 애플리케이션을 생성하기 위한 AI 지원 오픈 소스 딥 러닝 프레임워크, 라이브러리 및 도구를 탐색하여 작업을 계속 발전시키고 있습니다. NVIDIA 오픈 소스 NeMo 프레임워크의 다양한 신경망 아키텍처와 토폴로지를 사용하여 실험이 수행되었으며, Citrinet 및 Conformer-CTC 네트워크 토폴로지는 음성 인식을 위한 신경 음향 모델을 구축하고 훈련하는 데 효과적인 것으로 입증되었습니다. 이러한 모델은 단일 및 다중 노드 Param Siddhi AI 시스템에서 훈련되어 훈련 시간과 성능을 최적화했습니다. 마지막으로 Riva GPU 가속 프로덕션 파이프라인을 사용하여 실시간 및 배치 모드 추론을 위해 모델이 배포되었습니다.
Singtel Group의 자회사인 NCS는 아시아 태평양 지역에 진출한 선도적인 기술 서비스 회사로 정부 및 기업과 협력하여 기술을 통해 지역 사회를 발전시키고 있습니다. NCS는 61개 전문 분야에 걸쳐 12,000명으로 구성된 강력한 팀의 경험과 전문 지식을 결합하여 디지털, 데이터, 클라우드 및 플랫폼 분야의 NEXT 기능은 물론 애플리케이션, 인프라 분야의 핵심 제품을 통해 고객에게 차별화된 엔드 투 엔드 기술 서비스를 제공합니다. , 엔지니어링 및 사이버 보안. NCS는 또한 개방형 혁신과 공동 창작을 지원하기 위해 선도적인 기술 기업, 연구 기관 및 스타트업과 함께 강력한 파트너 생태계를 구축하는 것이 중요하다고 믿습니다.
NCS는 음성 안내 내비게이션, 실시간 교통 및 도로 상태 업데이트, 실시간 주차 요금, 전자 도로 가격 요금 및 운영 시간을 위해 운전자 동반 앱인 Breeze의 NVIDIA Riva TTS를 사용하여 싱가포르 운전자가 원활한 운전 여행을 경험할 수 있도록 돕습니다.
breeze.com.sg/
www.ncs.co
고객 스토리
글로벌 엔터프라이즈 클라우드 커뮤니케이션, 협업, 컨택 센터 솔루션 분야의 선두 제공업체인 RingCentral은 수백만 명의 사용자에게 서비스를 제공하고 있습니다. RingCentral 플랫폼은 모든 위치와 장치에서 협업을 지원하여 비즈니스 효율성과 고객 만족도를 향상시킵니다.
RingCentral은 자사 플랫폼의 동시 사용자 200,000명의 화상 회의 녹취를 위해 NVIDIA Riva를 사용합니다.
www.ringcentral.com
GTC 세션
Snap은 필터와 효과를 사용하여 멀티미디어 메시지 생성을 가능하게 하는 카메라 및 소셜 미디어 회사입니다. 더 많은 대화형 경험을 만들기 위해 Snapchat 사용자는 스냅에 실시간 효과를 추가하는 기능인 렌즈를 하루에 60억 번 이상 사용합니다.
NVIDIA Riva의 소음 및 언어 최적화 음성 AI 서비스는 Snap AR Lens Studio에 통합되어 크리에이터(예술가 및 개발자)가 몰입도 높은 증강 현실(AR) 경험을 구축할 수 있도록 지원합니다.
강력한 언캐리어인 T-Mobile은 최고의 고객 경험을 위해 고급 4G LTE와 혁신적인 5G 네트워크를 제공합니다. 연락 센터 상담원의 역량을 강화하기 위해 T-Mobile은 Expert Assist를 구현합니다. 이 AI 기반 소프트웨어는 NVIDIA Riva를 사용하여 추천자에게 제공하고 수천 명의 상담원을 지원하는 실시간 고객 대화를 기록합니다.
Riva를 통해 T-Mobile은 맞춤형 데이터 세트에서 자동 음성 인식 모델을 미세 조정하고 시끄러운 환경에서 고객 전문 용어를 정확하게 해석합니다.
www.t-mobile.com
귀하의 질문에 답하고 조직의 니즈를 도와드리겠습니다.
NVIDIA 개인정보보호정책