NVIDIA がデジタル ヒューマン マイクロサービスをリリース、生成 AI アバターの未来への道を開く

NVIDIA ACE がクラウド向けに一般提供開始し、RTX AI PC 向けに早期アクセスを開始。Dell Technologies、ServiceNow、Aww Inc.、Inventec、Perfect World Games などカスタマー サービス、ゲーミング、ヘルスケア分野の企業にて導入へ

台湾、台北 — COMPUTEX — 2024 年 6 月 2 日 — NVIDIA は本日、デジタル ヒューマンの次なる発展を加速する NVIDIA ACE 生成 AI マイクロサービスの一般提供の開始と、プラットフォームに近日登場する新しい生成 AI のブレイクスルーを発表しました。カスタマー サービス、ゲーミング、ヘルスケアの企業が、カスタマー サービス、遠隔医療、ゲーミング、エンターテインメントの分野でリアルなデジタル ヒューマンの作成、アニメーション化、および操作を簡素化するために、ACE テクノロジを最初に採用しています。

現在一般提供されている NVIDIA ACE デジタル ヒューマン生成 AI テクノロジ スイートには、次のものが含まれます。

  • NVIDIA Riva ASR、TTS、NMT — 自動音声認識、テキストから音声への変換、翻訳用
  • NVIDIA Nemotron LLM — 言語理解とコンテキストに即した応答生成用
  • NVIDIA Audio2Face — オーディオ トラックに基づくリアルなファイシャル アニメーション用
  • NVIDIA Omniverse RTX — リアルタイムでパストレースされたリアルな肌と髪用

新たに発表されたテクノロジには次のものが含まれます:

  • NVIDIA Audio2Gesture — オーディオ トラックに基づくボディ ジェスチャーの生成用。近日提供開始予定
  • NVIDIA Nemotron-3 4.5B — 低遅延でオンデバイスの RTX AI PC 推論用に特別に構築された新しい小規模言語モデル (SLM)

「デジタル ヒューマンは業界に革命を起こすでしょう」と語るのは、NVIDIA の創業者/CEO であるジェンスン フアン (Jensen Huang) です。「NVIDIA ACE が開発者のエコシステムに提供する、マルチモーダルの大規模言語モデルとニューラル グラフィックスのブレイクスルーにより、コンピューターとのやり取りが人間とのやり取りと同じくらい自然になる、意図駆動型のコンピューティングの未来が近づいています」

デジタル ヒューマンが 1 億台の RTX AI PC に登場
これまで、NVIDIA は開発者がデータセンターで操作できるように、ACE を NIM マイクロサービスとして提供してきました。現在、NVIDIA は 1 億台の RTX AI PC とノート PC のインストール ベース全体に展開するための ACE PC NIM マイクロサービスを構築しています。

これらには、初の小規模言語モデル (SLM) である NVIDIA Nemotron-3 4.5B が含まれます。これは、クラウドで実行される大規模言語モデル (LLM) と同等の精度と正確さでデバイス上において実行できるように特別に構築されています。Nemotron-3 4.5B SLM は現在、早期アクセス中です。NVIDIA Audio2Face および NVIDIA Riva ASR オンデバイス モデルも、まもなく早期アクセスで利用可能になります。

新しい NVIDIA AI Inference Manager ソフトウェア開発キットにより、ACE の PC への展開が簡素化されます。必要な AI モデル、エンジン、依存関係を PC に事前構成しながら、PC とクラウド全体で AI 推論をシームレスにオーケストレーションします。

Inworld AI と共同で開発された Covert Protocol 技術デモのアップデート版が、COMPUTEX で公開されています。このデモでは、GeForce RTX PC 上でローカルに実行される Audio2Face と Riva ASR を使用して、プレイヤーがデジタル ヒューマンのノン プレイ キャラクター (NPC) と言語で対話し、影響を与えてミッションを完了できます。

最新の ACE テクノロジによりデジタル ヒューマン エコシステムが拡大

ACE は、Aww Inc.、Dell Technologies、Gumption、Hippocratic AI、Inventec、OurPalm、Perfect World Games、Reallusion、ServiceNow、Soulbotix、SoulShell、UneeQ などの企業のさまざまなアプリケーションを開発する開発者の間で大きな注目を集めています。

日本を拠点とする先駆的なバーチャル ヒューマン企業である Aww Inc. は、2018 年に初のバーチャル セレブリティ Imma を発表しました。Imma はそれ以来、50 か国以上で主要なグローバル ブランドの顔となっています。現在、Aww Inc. は、ACE Audio2Face マイクロサービスをリアルタイム アニメーションに活用し、ユーザーとの高度にインタラクティブなコミュニケーション体験を実現する予定です。

ゲーム開発者兼パブリッシャーの Perfect World Games は、神話の荒野を舞台にした新しい技術デモ「Legends」で ACE を採用しています。プレイヤーは、英語と中国語の両方で、完全にインタラクティブでリアルな多言語 AI NPC と対話できます。NVIDIA Audio2Face NIM を使用すると、キャラクターの応答音声からリアルなファイシャル アニメーションがリアルタイムで生成されます。

AIに多額の投資を行っている大手テクノロジ企業 Inventec は、NVIDIA Audio2Face NIM を使用して、VRSTATE プラットフォーム内のヘルスケア AI エージェントを強化しています。この統合により、より魅力的で快適な仮想相談体験が実現します。COMPUTEX では、患者が健康に関する情報にアクセスできるように支援する AI エージェントを Inventec が展示しています。

ビジネス変革のための AI プラットフォームである ServiceNow は最近、Now Assist Gen AI Experience の生成 AI サービス エージェント デモで ACE NIM を展示し、小売、旅行などの業界全体でデジタル アバターが顧客と従業員のやり取りを強化する可能性を強調しました。

Dell Technologies は先月、Dell Technologies World で最先端の Dell Generative AI Solution for Digital Assistants を発表しました。このソリューションにより、企業は小売、ヘルスケア、カスタマー サービスなどさまざまな業界で自然な会話を通じて顧客と関わるインテリジェントなデジタル アシスタントを活用できます。

NVIDIA が COMPUTEX 2024 でデジタル ヒューマン スタートアップを称える
NVIDIA のアート チームは、SynthesiaHour One など、ACE 上に構築された生成 AI ツールを使用して、テキストからビデオで生成された「digital Jensen」アバターを制作しました。この多言語アバターは、中国語と英語で ElevenLabs 独自の AI スピーチおよび音声テクノロジによって生成された フアン のユニークな声とスタイルを特徴としています。NVIDIA はまた、AI 音声テクノロジを専門とする NVIDIA Inception メンバーの Voicemod と協業し、フアンの基調講演のエンディング テーマ曲を作曲しました。

ACE NIM が利用可能に
Riva や Audio2Face などのサーバー展開向けの NVIDIA ACE NIM マイクロサービスが現在稼働中であり、開発者がエンタープライズクラスのサポートを受けられる NVIDIA AI Enterprise ソフトウェアが追加されています。RTX AI PC で実行される ACE NIM マイクロサービスへの早期アクセスに登録してください。

フアンの COMPUTEX 基調講演を視聴して、ACE コンテンツの最新情報をご確認ください。

NVIDIA について
1993年の創業以来、NVIDIA(https://www.nvidia.com/ja-jp/)(NASDAQ: NVDA) はアクセラレーテッド コンピューティングのパイオニアです。同社が 1999 年に発明した GPU は、PC ゲーム市場の成長を促進し、コンピューター グラフィックスを再定義して、現代の AI の時代に火をつけながら、各種産業のデジタル化を後押ししています。NVIDIA は現在、業界を再形成しているデータセンター規模の製品を提供するフルスタック コンピューティング企業です。詳細は、こちらのリンクから:https://nvidianews.nvidia.com/

本プレスリリースには、以下に関する記述が含まれますが、これらに限定されません。 NVIDIA ACE 生成 AI マイクロサービス、NVIDIA Riva ASR、TTS および NMT、NVIDIA Nemotron LLM および SLM、NVIDIA Audio2Face、NVIDIA Audio2Gesture、NVIDIA Omniverse RTX、NVIDIA Nemotron-3 4.5B、NVIDIA AI Inference Manager、NVIDIA AI Enterprise ソフトウェアを含む NVIDIA の製品およびテクノロジーの利点、影響、パフォーマンス、機能、可用性、NVIDIA とサードパーティのコラボレーションの利点と影響、およびそのサービスと提供の機能と可用性、サードパーティによる NVIDIA 製品、テクノロジー、プラットフォームの使用または採用、およびその利点と影響、デジタル ヒューマンによる業界への革命など。NVIDIA ACE によって開発者エコシステムに提供される、マルチモーダル大規模言語モデルとニューラル グラフィックスのブレークスルーにより、コンピューターとの対話が人間との対話と同じくらい自然になる、インテント ドリブン コンピューティングの未来がさらに近づきます。これらは将来予想に関する記述であり、リスクと不確実性により、予測とは大幅に異なる結果が生じる可能性があります。実際の結果が大幅に異なる可能性がある重要な要因には、世界経済の状況、製品の製造、組み立て、パッケージング、テストにおけるサードパーティへの依存、技術開発と競争の影響、新しい製品や技術の開発、または既存の製品や技術の機能強化、当社製品またはパートナー製品の市場での受け入れ、設計、製造、またはソフトウェアの欠陥、消費者の嗜好や需要の変化、業界標準やインターフェイスの変更、システムに統合されたときの製品または技術の予期しないパフォーマンスの低下、および NVIDIA が米国証券取引委員会 (SEC) に提出する最新のレポート (Form 10-K の年次レポート、Form 10-Q の四半期レポートなど) に随時記載されるその他の要因が含まれます。 SEC に提出された報告書のコピーは、同社の ウェブサイトに掲載されており、NVIDIA から無料で入手できます。これらの将来予想に関する記述は将来の業績を保証するものではなく、発表日時点の見解のみを述べたものであり、法律で義務付けられている場合を除き、NVIDIA は将来の出来事や状況を反映するためにこれらの将来予想に関する記述を更新する義務を一切負いません。

© 2024 NVIDIA Corporation. 無断複写・転載を禁じます。NVIDIA、NVIDIAロゴ、Audio2Face、NVIDIA NeMo、NVIDIA Omniverse、および NVIDIA RTX は、米国およびその他の国におけるNVIDIA Corporationの商標および/または登録商標です。その他の会社名および製品名は、関連する各社の商標である場合があります。機能、価格、可用性および仕様は予告なく変更される場合があります。