NVIDIA® Riva는 완전히 맞춤화 가능한 실시간 대화형 AI 파이프라인을 구축하기 위한 GPU 가속 다국어 음성 및 번역 마이크로 서비스 세트입니다. Riva는 자동 음성 인식(ASR), 텍스트-음성 변환(TTS), 신경망 기계 번역(NMT)을 포함하며 모든 클라우드, 데이터센터, 엣지 또는 임베디드 디바이스에 배포할 수 있습니다. 조직은 Riva를 통해 거대 언어 모델(LLM) 및 검색 증강 생성(RAG)을 활용하여 음성 및 번역 인터페이스를 추가함으로써 챗봇을 매력적이고 표현력이 풍부한 다국어 어시스턴트 및 아바타로 만들 수 있습니다.
기업들은 Q&A 어시스턴트를 배포하여 24시간 내내 수백만 명의 고객과 직원의 문의를 자동으로 해결하고 있습니다. Riva의 음성 및 번역 AI 마이크로 서비스를 통해 이러한 어시스턴트는 배경 노이즈, 낮은 음질, 다양한 화자 방언 및 억양에도 불구하고 대화의 모든 단계에서 유용하고 자연스러운 응답을 제공합니다.
매일 수억 건의 온라인 회의가 열리는 가운데, 화상 회의는 엔터프라이즈에 필수적인 도구가 되었습니다. 화상 회의 애플리케이션은 Riva의 실시간 전사 기능을 통해 실시간 자막 및 회의 요약에서 놀라운 정확도를 달성하여 전 세계의 억양과 다양한 영역별 어휘를 가진 사용자를 수용합니다.
글로벌 경제에서 기업들은 여러 국가에서 운영되며 다양한 언어 및 문화적 배경을 가진 고객에게 서비스를 제공합니다. 원어민을 고용하고 다국어로 직원을 교육하는 것은 확장 가능하지 않거나 비용 효율적이지 않거나 효과적이지 않기 때문에 글로벌 언어의 이러한 다양성은 고유한 문제를 제기합니다. Riva 번역은 정확하고 효과적인 커뮤니케이션을 지원하여 원활한 글로벌 상호 작용을 촉진합니다.
서비스 로봇은 전 세계 병원, 공항 및 소매점에서 점점 더 많이 사용되고 있습니다. 레스토랑과 제조 시설에서 매일 반복되는 작업을 처리하여 최전선 근로자를 지원하고, 고객이 매장에서 품목을 찾을 수 있도록 도우며, 환자를 돌보는 의사와 간호사를 지원합니다. Riva를 사용하면 음성 및 번역 AI를 서비스 로봇에 쉽게 추가할 수 있습니다.
2021년 AI2Labs는 유주게임즈(Yoozoo Games)에서 싱가포르 현지 기술 스타트업으로 분사되었습니다. AI2Labs는 AI 제품과 애플리케이션을 혁신, 실험, 개발하여 효율적인 프로세스를 지원하고 지속 가능성과 비즈니스 성과를 개선합니다.
AI2Labs는 Riva를 도메인별 음성 AI인 Speakr 음성 인식 API에 통합하여 아시아 음성 및 비즈니스 도메인의 복잡성을 수용하고 최첨단 Singlish 번역 정확도를 달성했습니다.
Avaya
Avaya는 OneCloud 플랫폼을 통해 통합 커뮤니케이션, 연락 센터, 서비스형 커뮤니케이션 플랫폼(CPaaS) 및 서비스를 제공하는 클라우드 커뮤니케이션 및 작업 흐름 협업 솔루션을 전문으로 합니다.
Avaya는 대규모 실시간 캡션을 위해 NVIDIA Riva 음성 텍스트 변환 엔진을 통합했습니다. Riva는 더 나은 전사 품질, 낮은 단어 오류율 및 경제적인 전달을 가능하게 합니다.
C-DAC
인도 푸네에 위치한 C-DAC의 Applied AI Group은 10년 넘게 음성 기술 연구 및 개발에 주력해 왔습니다. 그들은 힌디어와 마라티어와 같은 인도어를 위한 최첨단 음성 텍스트 변환(STT) 시스템을 성공적으로 만들었습니다. 이 그룹은 다른 인도어 및 저자원 언어용 STT 및 음성 지원 애플리케이션을 생성하기 위한 AI 지원 오픈 소스 딥 러닝 프레임워크, 라이브러리 및 도구를 탐색하여 작업을 계속 발전시키고 있습니다. NVIDIA 오픈 소스 NeMo 프레임워크의 다양한 신경망 아키텍처와 토폴로지를 사용하여 실험이 수행되었으며, Citrinet 및 Conformer-CTC 네트워크 토폴로지는 음성 인식을 위한 신경 음향 모델을 구축하고 훈련하는 데 효과적인 것으로 입증되었습니다. 이러한 모델은 단일 및 다중 노드 Param Siddhi AI 시스템에서 훈련되어 훈련 시간과 성능을 최적화했습니다. 마지막으로 Riva GPU 가속 프로덕션 파이프라인을 사용하여 실시간 및 배치 모드 추론을 위해 모델이 배포되었습니다.
NCS
Singtel Group의 자회사인 NCS는 아시아 태평양 지역에 진출한 선도적인 기술 서비스 회사로 정부 및 기업과 협력하여 기술을 통해 지역 사회를 발전시키고 있습니다. NCS는 61개 전문 분야에 걸쳐 12,000명으로 구성된 강력한 팀의 경험과 전문 지식을 결합하여 디지털, 데이터, 클라우드 및 플랫폼 분야의 NEXT 기능은 물론 애플리케이션, 인프라 분야의 핵심 제품을 통해 고객에게 차별화된 엔드 투 엔드 기술 서비스를 제공합니다. , 엔지니어링 및 사이버 보안. NCS는 또한 개방형 혁신과 공동 창작을 지원하기 위해 선도적인 기술 기업, 연구 기관 및 스타트업과 함께 강력한 파트너 생태계를 구축하는 것이 중요하다고 믿습니다.
NCS는 음성 안내 내비게이션, 실시간 교통 및 도로 상태 업데이트, 실시간 주차 요금, 전자 도로 가격 요금 및 운영 시간을 위해 운전자 동반 앱인 Breeze의 NVIDIA Riva TTS를 사용하여 싱가포르 운전자가 원활한 운전 여행을 경험할 수 있도록 돕습니다.
글로벌 엔터프라이즈 클라우드 커뮤니케이션, 협업, 컨택 센터 솔루션 분야의 선두 제공업체인 RingCentral은 수백만 명의 사용자에게 서비스를 제공하고 있습니다. RingCentral 플랫폼은 모든 위치와 장치에서 협업을 지원하여 비즈니스 효율성과 고객 만족도를 향상시킵니다.
RingCentral은 자사 플랫폼의 동시 사용자 200,000명의 화상 회의 녹취를 위해 NVIDIA Riva를 사용합니다.
Snap은 필터와 효과를 사용하여 멀티미디어 메시지 생성을 가능하게 하는 카메라 및 소셜 미디어 회사입니다. 더 많은 대화형 경험을 만들기 위해 Snapchat 사용자는 스냅에 실시간 효과를 추가하는 기능인 렌즈를 하루에 60억 번 이상 사용합니다.
NVIDIA Riva의 소음 및 언어 최적화 음성 AI 서비스는 Snap AR Lens Studio에 통합되어 크리에이터(예술가 및 개발자)가 몰입도 높은 증강 현실(AR) 경험을 구축할 수 있도록 지원합니다.
T-Mobile
강력한 언캐리어인 T-Mobile은 최고의 고객 경험을 위해 고급 4G LTE와 혁신적인 5G 네트워크를 제공합니다. 연락 센터 상담원의 역량을 강화하기 위해 T-Mobile은 Expert Assist를 구현합니다. 이 AI 기반 소프트웨어는 NVIDIA Riva를 사용하여 추천자에게 제공하고 수천 명의 상담원을 지원하는 실시간 고객 대화를 기록합니다.
Riva를 통해 T-Mobile은 맞춤형 데이터 세트에서 자동 음성 인식 모델을 미세 조정하고 시끄러운 환경에서 고객 전문 용어를 정확하게 해석합니다.