NVIDIA、新たな推論ソフトウェアにより、インタラクティブな対話型 AI の時代を主導

NVIDIA TensorRT 7 のコンパイラを活用したリアルタイム推論により、よりスマートなヒューマンコンピュータインタラクションを実現

2019 年 12 月 18 日、中国蘇州 — GTC China — NVIDIA は、あらゆる場所の開発者が対話型 AI アプリケーションを実現するために使用できる画期的な推論ソフトウェアを発表しました。これまで真のインタラクティブなエンゲージメントの実現を妨げていた推論の遅延を大幅に削減します。

NVIDIA の第 7 世代の推論ソフトウェア開発キットである NVIDIA TensorRT™ 7 は、よりスマートなヒューマンコンピュータインタラクションの時代の扉を開くもので、音声エージェントやチャットボット、レコメンドエンジンといったアプリケーションを使った、リアルタイムのエンゲージメントを可能にします。

Juniper Research によれば、全世界のデバイスで 32 億 5,000 万のデジタル音声アシスタントが使用されていると推定されています。2023 年までには、その数が 80 億に達し、世界の総人口を上回るようになると予想されています。

TensorRT 7 は、AI 音声アプリケーションに必要な複雑さが増す一方のリカレントやトランスフォーマーベースのニューラルネットワークを自動的に最適化および高速化するように設計された、新しいディープラーニングコンパイラを特長としています。これにより、対話型 AI の各コンポーネントが、CPU で実行される場合と比較して10 倍以上高速化し、遅延がリアルタイムインタラクションに必要と考えられている 300 ミリ秒のしきい値を下回ります。

GTC China の基調講演にて、NVIDIA の創業者/CEO であるジェンスンフアン (Jensen Huang) は、次のように述べています。「私たちは AI の新しい章を迎えました。機械が人間の言語をリアルタイムで理解する能力を持つようになります。TensorRT 7 により、これが実現され、より自然に人間と AI とのやり取りを可能にする、より高速でよりスマートな対話型 AI サービスを構築し展開するためのツールを世界中の開発者に提供します。」

世界で最大規模の、最も革新的な企業のいくつかは、NVIDIA の対話型 AI アクセラレーション機能をすでに活用しています。そのような企業の 1 つが Sogou (捜狗) です。同社は、世界で最も多く使用されている携帯電話アプリケーションである WeChat に検索サービスを提供しています。

Sogou の CTO であるヤンホンタオ (Yang Hongtao) 氏は、次のように述べています。「Sogou は、音声、画像、翻訳、対話および Q&A といった高品質な AI サービスを数億人のユーザーに毎日提供しています。NVIDIA TensorRT の推論プラットフォームを採用することにより、当社はオンラインサービスでの応答をリアルタイムでできるようになります。これらの先進的な AI 機能により、当社のユーザー体験が大幅に向上しました。」

リカレントニューラルネットワークの重要度が増大
TensorRT 7 は、RNN と呼ばれる再帰ループ構造を使った、時系列的なシーケンスデータのシナリオを予測するために使われる AI モデルの世界の発展を加速します。RNN は、対話型 AI の音声ネットワークだけでなく、自動車または衛星の到着時間計画、電子医療記録のイベント予測、金融資産予想および不正検知にも利用できます。

RNN の構成と機能の組み合わせが爆発的に増えているため、リアルタイム性能の基準を満たしたプロダクションコードを迅速に展開するという課題も生まれており、開発者が手書きのコードを最適化しなければならないために、数か月の遅れが出る場合もあります。その結果、対話型 AI の利用は、必要な人材を持つ少数の企業だけに限られてきました。

TensorRT の新しいディープラーニングコンパイラを使うと、あらゆる開発者が独自の自動音声認識ネットワークや、テキストから音声への変換のための WaveRNN や Tacotron 2 といったネットワークを自動的に最適化できるようになり、最高の性能と最小の遅延を実現する力を手に入れられます。

この新しいコンパイラにより、自然言語処理のための BERT のようなトランスフォーマーベースのモデルも最適化できるようになります。

エッジからクラウドまで、推論を加速
TensorRT 7 により、トレーニング済みのニューラルネットワークを短期間で最適化、検証および展開可能になるので、ハイパースケールデータセンター、組み込みまたは単体の GPU プラットフォームで推論を行えるようになります。

NVIDIA の推論プラットフォームには、TensorRT、複数の NVIDIA CUDA-X AI™ ライブラリおよび NVIDIA GPU が含まれており、画像分類や不正検知、セグメンテーション、物体検知、レコメンドエンジンといった対話型 AI 以外のアプリケーションにも、低遅延かつ高スループットの推論を実現します。その機能は、Alibaba や American Express、Baidu、PayPal、Pinterest、Snap、Tencent、Twitter といった、世界のいくつかの大手エンタープライズおよび消費者向けテクノロジ企業で、広く利用されています。

利用方法
TensorRT 7 は今後数日のうちに NVIDIA 開発者プログラムのメンバーに TensorRT ウェブページを通じて、無償で提供され、開発およびデプロイメントに利用できるようになります。最新バージョンのプラグイン、パーサーおよびサンプルは、TensorRT GitHub リポジトリよりオープンソースとして入手することもできます。

NVIDIA について
1999 年における NVIDIA (NASDAQ 表示: NVDA) による GPU の発明は、PC ゲーミング市場の成長に爆発的な拍車をかけ、現代のコンピューターグラフィックスを再定義し、並列コンピューティングに革命的変化を起こしました。最近では、GPU ディープラーニングが最新の AI (次世代コンピューティング) に火をつけ、世界を知覚し理解することができるコンピューター、ロボット、自律走行車の脳として GPU は機能しています。詳細は、こちらのリンクから: www.nvidia.com/ja-jp/

NVIDIA TensorRT 7 および NVIDIA の推論プラットフォームの利益、影響および可用性、世界中のデジタル音声アシスタントの推定台数および成長の予測、機械が人間の言語をリアルタイムで理解することが可能になることにより、AI の新たな章を迎えること、およびRNN の構成と機能の組み合わせが爆発的に増えることによる影響など、本プレスリリースにおける一定の記載は将来の見通しに関する記述であり、予測とは著しく異なる結果を生ずる可能性があるリスクと不確実性を伴っています。かかるリスクと不確実性は、世界的な経済環境、サードパーティに依存する製品の製造・組立・梱包・試験、技術開発および競合による影響、新しい製品やテクノロジの開発あるいは既存の製品やテクノロジの改良、当社製品やパートナー企業の製品の市場への浸透、デザイン・製造あるいはソフトウェアの欠陥、ユーザーの嗜好および需要の変化、業界標準やインターフェイスの変更、システム統合時に当社製品および技術の予期せぬパフォーマンスにより生じる損失などを含み、その他のリスクの詳細に関しては、Form 10-K での NVIDIA のアニュアルレポートならびに Form 10-Q での四半期レポートなど、米証券取引委員会 (SEC) に提出されている NVIDIA の報告書に適宜記載されます。SEC への提出書類は写しが NVIDIA の Web サイトに掲載されており、NVIDIA から無償で入手することができます。これらの将来予測的な記述は発表日時点の見解に基づくものであって将来的な業績を保証するものではなく、法律による定めがある場合を除き、今後発生する事態や環境の変化に応じてこれらの記述を更新する義務を NVIDIA は一切負いません。

© 2019 NVIDIA Corporation. All rights reserved. NVIDIA、NVIDIA のロゴ、CUDA-X AI および TensorRT は、米国およびその他の国における NVIDIA Corporation の商標または登録商標です。その他の会社名および製品名は、それぞれの所有企業の商標または登録商標である可能性があります。機能、価格、可用性、および仕様は予告なしに変更されることがあります。