消費者向け金融でインテリジェント コールセンターの業務を変革する
AI の機能はベトナムで多くの銀行や金融機関に注目されていますが、その中の 1 社が Home Credit Vietnam です。Home Credit Vietnam はベトナムで業界をリードするデジタル金融会社であり、顧客体験を常に最優先としてきました。プロセス自動化と業務効率の重要性を認めていた Home Credit は FPT Smart Cloud と業務提携し、AI がベトナムではまだ比較的新しいコンセプトであった 2019 年に FPT AI Engage ソリューションを配備し、同社の戦略的展望を示しました。
2020 年が運用の最初の年となった FPT.AI Virtual Agent for Call Center は、Home Credit Vietnam の毎月 500 万件を超える通話をサポートしました。これが NVIDIA のパワーでピーク時には、1,200 万件にスケールアップし、経費を 50% 削減し、98% の通話成功率を達成しました。さらに、Home Credit Vietnam の「バーチャルアシスタント」の顧客満足度は平均で 4.5/5 でした。
このデプロイは NVIDIA® TensorRT™ で最適化され、NVIDIA Triton™ Inference Server で動的バッチ処理を用いて提供されています。同じ品質のモデル出力を維持しながら、高性能コンピューティング リソースを最大 20% 節約しています。
これまでのところ、Home Credit Vietnam は、情報照会、カードのロックや有効化のセルフサービス、自動顧客調査、債権回収など、100 を超えるユースケースを実用化しています。結果的に、こうした単純作業が AI の仕事となり、顧客関連の重大な問題に人間のエージェントが費やせる時間が増えました。
バーチャルアシスタントの新しい用途のひとつで、カスタマーサービス部署などの「コストがかかる部署」を「利益を生み出す部署」に変えられるのが「Service to Sales」と呼ばれているプロセスです。FPT AI Engage は Home Credit Vietnam の Service to Sales 量を 2 倍に増やしました。
こうしたイノベーションは、デジタル体験を強化するには、バーチャルアシスタントの顧客とのやりとりをもっと人間に近くする必要があることを示しています。その結果、AI が生成する音声の品質が注目されるようになりました。
合成音声はバーチャルアシスタントと並行して開発され、さまざまなトーン、アクセント、センチメントが利用できます。配備される音声の種類は用途によって異なります。たとえば、一般的な問い合わせ向けのバーチャルアシスタントの場合、親しみやすく、情報的なトーンが使用されます。電話販売向けの AI 音声の場合、見込み顧客をうまく説得できるよう、柔軟で感情豊かになります。
対話の品質をアップグレードする高度な音声合成モデル
声が人間にもっと近く、感情豊かなバーチャルアシスタントに対する需要増加を認識している FPT Smart Cloud は、わずか数分のオーディオサンプルをベースに新しい音声を生み出せる音声合成モデルの開発を目指しています。生成された音声は、高品質で人間の声と区別できず、複数の言語で (トレーニングでベトナム語が入力されても) 意思疎通できるものでなければなりません。
人間の言葉のニュアンスや感情的雰囲気を考慮すると、音声合成モデルは多くの場合、精度と表現の最適化に膨大な量のトレーニングデータと長時間の処理を必要とします。
モデルトレーニングは以前、NVIDIA A100 Tensor コア GPU で実行されていました。典型的なトレーニングには、3 台のサーバー、1 日あたり 100 時間の音声データを処理する能力、20 日間の期間を必要とします。NVIDIA H100 Tensor コア GPU にアップグレードすると、もっと複雑なモデル要件を処理できることと、2,000 時間のオーディオデータで処理時間が少なくとも 3 分の 1 に、または 7 日間に短縮されることが期待されます。
H100 を導入すると、すべてのプロセスで必要とされる専用サーバーがたった 1 台になります。音声合成モデルは 5 日で用意されます。1 日あたり 400 時間分の音声サンプルを処理した NVIDIA A100 と比較して効率性が 4 倍向上します。出力モデルの品質と精度は 100 倍向上しました。人間のように聞こえる音声を生成し、その音声を、ベトナム語、英語、インドネシア語を含む、18 の言語にシームレスに移行できます。
A100 と比較し、H100 は AI 音声モデリングの性能が一段階上がっており、言語の壁を破り、前例のないスケールでグローバルなコミュニケーションを可能にしています。AI の力で大きく前進した FPT Smart Cloud は、バーチャルアシスタントの精度と柔軟性を上げるため、大規模言語モデルに NVIDIA H100 も利用しています。