음성 AI
거대 언어 모델과 검색 증강 생성 기반 애플리케이션을 위해 완전히 맞춤화 가능한 다국어 음성 및 번역 AI를 구축 및 배포하세요.
영상 | 솔루션 개요 | 개발자용
NVIDIA® Riva는 완전히 맞춤화 가능한 실시간 대화형 AI 파이프라인을 구축하기 위한 GPU 가속 다국어 음성 및 번역 마이크로 서비스 세트입니다. Riva는 자동 음성 인식(ASR), 텍스트 음성 변환(TTS), 신경망 기계 번역(NMT)을 포함하며 모든 클라우드, 데이터센터, 엣지 또는 임베디드 디바이스에 배포할 수 있습니다. 조직은 Riva를 통해 대규모 언어 모델(LLM) 및 검색 증강 생성(RAG)을 활용하여 음성 및 번역 기능을 추가함으로써 챗봇을 강력한 다국어 어시스턴트 및 아바타로 만들 수 있습니다.
최첨단 다국어 전사, 번역, 음성을 통해 AI 챗봇을 제공합니다.
언어를 선택하고 Riva ASR이 마이크를 통해 입력을 제공하거나 디바이스에서 .wav 파일을 업로드하여 실시간으로 매우 정확한 전사를 제공하는 방법을 확인하세요.
참고: 각 샘플의 지속 시간은 30초로 제한됩니다.
음성을 선택하고 테스트 문장을 입력하면 Riva의 즉시 사용 가능한 영어로 말하는 여성 또는 남성의 음성을 들을 수 있습니다.
참고: 입력 텍스트 길이는 400자로 제한됩니다.
0 / 400
Riva 기술을 사용할 경우에는 NVIDIA Riva 사용 약관이 적용됩니다. 귀하의 데이터는 NVIDIA 제품 및 서비스를 개선하는 데 사용됩니다.
이중 언어 및 다국어 번역을 위한 높은 전사 정확도를 달성하고 NVIDIA 슈퍼컴퓨터에서 수천 시간의 오디오에 대해 사전 훈련된 최첨단 모델을 통해 표현력이 뛰어난 전문 여성 및 남성 목소리를 배포할 수 있습니다.
다양한 언어, 악센트, 도메인, 어휘 및 컨텍스트에 대해 ASR 파이프라인 전체를 사용자 정의하여 사용 사례에 가장 적합한 정확성을 확보하고 TTS 파이프라인 전체를 원하는 음성 및 억양으로 맞춤화하세요.
데이터 센터, 온프레미스, 클라우드, 에지 또는 임베디드 장치에서 기존 기술에 비해 더 높은 추론 성능과 원하는 배포를 통해 수십만 개의 입력 스트림에 대한 일관된 경험을 고객에게 제공합니다.
적합한 도구를 사용하여 완전히 맞춤화 가능한 다국어 음성 및 번역 AI 애플리케이션을 구축하고 배포하세요.
API 및 UI 기반 데모를 통해 샘플 데이터를 사용하여 Riva를 무료 체험하려는 개인을 위해 NVIDIA는 NVIDIA AI 기반 모델 및 엔드포인트를 훌륭한 탐색 시작 수단으로 제공합니다.
프로덕션용 NVIDIA AI Enterprise를 구매하기 전 Riva를 사용해 보고 싶은 기업에는 무료로 시작할 수 있는 두 가지 옵션이 있습니다:
인프라 미보유: 기존 인프라를 보유하지 않은 기업의 경우 NVIDIA는 NVIDIA LaunchPad를 통해 무료 핸즈온 랩을 제공합니다.
인프라 보유: 기존 인프라를 보유한 기업의 경우 NVIDIA는 NVIDIA AI Enterprise를 90일 동안 사용해 볼 수 있는 무료 평가판 라이선스를 제공합니다.
T-Mobile uses NVIDIA Riva ASR in their call center to accurately transcribe customer conversations and provide real-time recommendations to help agents quickly resolve customer queries.
T-Mobile은 콜센터에서 NVIDIA Riva ASR을 사용하여 고객 대화를 정확하게 기록하고 상담원이 고객 문의를 신속하게 해결할 수 있도록 실시간 권장 사항을 제공합니다.
NCS는 NVIDIA Riva TTS를 사용하여 운전자의 동반자 앱인 수천 명에 달하는 Breeze 활성 월간 사용자의 현지 발음, 어조, 억양으로 싱가포르 음성을 맞춤화했습니다.
Tarteel은 NVIDIA Riva 및 NVIDIA NeMo™를 사용하여 대규모 꾸란 암송에 대한 실시간 피드백을 제공함으로써 무슬림, 강사, 콘텐츠 제작자 및 연구원이 꾸란에 참여할 수 있도록 합니다.
NVIDIA Riva를 통해 RingCentral은 화상 회의에서 비교할 수 없는 실시간 기록 정확도를 달성하여 다양한 억양과 도메인별 전문 용어를 사용하는 수백만 명의 사용자에게 서비스를 제공했습니다.
Data Monsters는 NVIDIA Riva를 사용하여 Plabook 앱에 음성 파이프라인을 추가하여 학생들이 음소 수준의 정확성을 읽고 평가하며 개별화된 피드백을 제공하도록 돕습니다.
Artisight는 음성 지원 키오스크를 통해 체크인을 자동화하고 대기 중인 환자에게 알리는 스마트 병원 솔루션을 개발했습니다. 이러한 솔루션은 맞춤형 음성 AI 애플리케이션을 통합하고 GPU 가속 NVIDIA Riva 텍스트 음성 변환 기술을 사용하여 실시간 성능을 제공합니다.
AT&T, Kore.ai, Deloitte 및 Sutherland가 다국어 ASR, 번역, TTS를 사용하여 더 빠르고 정확한 고객 셀프 서비스를 제공하고, 실시간으로 상담원의 생산성을 향상하고, 엔터프라이즈의 운영 효율성을 높이는 방법을 살펴보세요.
데이터 사이언스 및 AI 기술 전문가로부터 지원 범위 개선, 클레임 관리, 주문, 프로비저닝을 위한 버츄얼 어시스턴트 및 디지털 아바타부터 위험 완화를 위한 사기 감지 시스템에 이르기까지 업계에 혁명을 일으키고 있는 최첨단 NVIDIA Riva 음성 및 번역 AI 솔루션에 관해 알아보세요.
이 주문형 웹 세미나를 시청하여 음성 지원 디지털 에이전트 형태로 지능형 가상 비서를 구축하는 방법을 알아보세요. 고객 만족도를 높이기 위해 유연하고 완전히 사용자 정의 가능한 솔루션을 배포하는 방법을 소개하겠습니다.
Motorola와 SoftServ가 대화형 AI 경험에서 요구하는 속도와 규모로 가장 정확한 전사, 번역, 매력적인 목소리를 제공하는 방법을 확인하세요.
음성 및 번역 AI 서비스 구축에 도움이 되는 Riva의 주요 기능을 이해하세요.
튜토리얼, Jupyter 노트북, 문서 등 NVIDIA Riva를 사용하여 음성 및 번역 AI 파이프라인 구축을 시작하는 데 필요한 모든 것을 얻으세요.
Riva를 사용하여 음성 및 번역 AI 애플리케이션을 구축하고 배포하는 방법에 대한 기술 연습을 읽어보세요.
고성능 추론과 최소한의 노력으로 프로덕션에서 Riva ASR 및 TTS 모델을 통합하고 배포하는 방법을 알아보세요.
완전히 맞춤화 가능한 다국어 음성 및 번역 AI 애플리케이션을 구축하고 배포하는 데 적합한 라이선스를 찾거나 더 많은 개발 리소스를 살펴보세요.
NVIDIA AI Enterprise 를 통한 보안, API 안정성 및 지원을 제공하면서 파일럿에서 프로덕션으로 전환하는 과정에 관해 NVIDIA 제품 전문가와 상담하세요.
NVIDIA 뉴스레터를 구독하고 최신 뉴스와 다양한 업데이트를 받으세요.
2021년 AI2Labs는 유주게임즈(Yoozoo Games)에서 싱가포르 현지 기술 스타트업으로 분사되었습니다. AI2Labs는 AI 제품과 애플리케이션을 혁신, 실험, 개발하여 효율적인 프로세스를 지원하고 지속 가능성과 비즈니스 성과를 개선합니다.
AI2Labs는 Riva를 도메인별 음성 AI인 Speakr 음성 인식 API에 통합하여 아시아 음성 및 비즈니스 도메인의 복잡성을 수용하고 최첨단 Singlish 번역 정확도를 달성했습니다.
Avaya는 OneCloud 플랫폼을 통해 통합 커뮤니케이션, 연락 센터, 서비스형 커뮤니케이션 플랫폼(CPaaS) 및 서비스를 제공하는 클라우드 커뮤니케이션 및 작업 흐름 협업 솔루션을 전문으로 합니다.
Avaya는 대규모 실시간 캡션을 위해 NVIDIA Riva 음성 텍스트 변환 엔진을 통합했습니다. Riva는 더 나은 전사 품질, 낮은 단어 오류율 및 경제적인 전달을 가능하게 합니다.
인도 푸네에 위치한 C-DAC의 Applied AI Group은 10년 넘게 음성 기술 연구 및 개발에 주력해 왔습니다. 그들은 힌디어와 마라티어와 같은 인도어를 위한 최첨단 음성 텍스트 변환(STT) 시스템을 성공적으로 만들었습니다. 이 그룹은 다른 인도어 및 저자원 언어용 STT 및 음성 지원 애플리케이션을 생성하기 위한 AI 지원 오픈 소스 딥 러닝 프레임워크, 라이브러리 및 도구를 탐색하여 작업을 계속 발전시키고 있습니다. NVIDIA 오픈 소스 NeMo 프레임워크의 다양한 신경망 아키텍처와 토폴로지를 사용하여 실험이 수행되었으며, Citrinet 및 Conformer-CTC 네트워크 토폴로지는 음성 인식을 위한 신경 음향 모델을 구축하고 훈련하는 데 효과적인 것으로 입증되었습니다. 이러한 모델은 단일 및 다중 노드 Param Siddhi AI 시스템에서 훈련되어 훈련 시간과 성능을 최적화했습니다. 마지막으로 Riva GPU 가속 프로덕션 파이프라인을 사용하여 실시간 및 배치 모드 추론을 위해 모델이 배포되었습니다.
Singtel Group의 자회사인 NCS는 아시아 태평양 지역에 진출한 선도적인 기술 서비스 회사로 정부 및 기업과 협력하여 기술을 통해 지역 사회를 발전시키고 있습니다. NCS는 61개 전문 분야에 걸쳐 12,000명으로 구성된 강력한 팀의 경험과 전문 지식을 결합하여 디지털, 데이터, 클라우드 및 플랫폼 분야의 NEXT 기능은 물론 애플리케이션, 인프라 분야의 핵심 제품을 통해 고객에게 차별화된 엔드 투 엔드 기술 서비스를 제공합니다. , 엔지니어링 및 사이버 보안. NCS는 또한 개방형 혁신과 공동 창작을 지원하기 위해 선도적인 기술 기업, 연구 기관 및 스타트업과 함께 강력한 파트너 생태계를 구축하는 것이 중요하다고 믿습니다.
NCS는 음성 안내 내비게이션, 실시간 교통 및 도로 상태 업데이트, 실시간 주차 요금, 전자 도로 가격 요금 및 운영 시간을 위해 운전자 동반 앱인 Breeze의 NVIDIA Riva TTS를 사용하여 싱가포르 운전자가 원활한 운전 여행을 경험할 수 있도록 돕습니다.
breeze.com.sg/
www.ncs.co
고객 스토리
글로벌 엔터프라이즈 클라우드 커뮤니케이션, 협업, 컨택 센터 솔루션 분야의 선두 제공업체인 RingCentral은 수백만 명의 사용자에게 서비스를 제공하고 있습니다. RingCentral 플랫폼은 모든 위치와 장치에서 협업을 지원하여 비즈니스 효율성과 고객 만족도를 향상시킵니다.
RingCentral은 자사 플랫폼의 동시 사용자 200,000명의 화상 회의 녹취를 위해 NVIDIA Riva를 사용합니다.
www.ringcentral.com
GTC 세션
Snap은 필터와 효과를 사용하여 멀티미디어 메시지 생성을 가능하게 하는 카메라 및 소셜 미디어 회사입니다. 더 많은 대화형 경험을 만들기 위해 Snapchat 사용자는 스냅에 실시간 효과를 추가하는 기능인 렌즈를 하루에 60억 번 이상 사용합니다.
NVIDIA Riva의 소음 및 언어 최적화 음성 AI 서비스는 Snap AR Lens Studio에 통합되어 크리에이터(예술가 및 개발자)가 몰입도 높은 증강 현실(AR) 경험을 구축할 수 있도록 지원합니다.
강력한 언캐리어인 T-Mobile은 최고의 고객 경험을 위해 고급 4G LTE와 혁신적인 5G 네트워크를 제공합니다. 연락 센터 상담원의 역량을 강화하기 위해 T-Mobile은 Expert Assist를 구현합니다. 이 AI 기반 소프트웨어는 NVIDIA Riva를 사용하여 추천자에게 제공하고 수천 명의 상담원을 지원하는 실시간 고객 대화를 기록합니다.
Riva를 통해 T-Mobile은 맞춤형 데이터 세트에서 자동 음성 인식 모델을 미세 조정하고 시끄러운 환경에서 고객 전문 용어를 정확하게 해석합니다.
www.t-mobile.com
귀하의 질문에 답하고 조직의 니즈를 도와드리겠습니다.
NVIDIA 개인정보보호정책