NVIDIA AI Foundry が世界中の企業向けにカスタム Llama 3.1 生成 AI モデルを構築

  • 企業や国家は、NVIDIA AI Foundry で、Llama 3.1 405B および NVIDIA Nemotron モデルと組み合わせた独自のデータを使用して「スーパーモデル」を構築可能になりました。
  • NVIDIA AI Foundry は、キュレーション、合成データ生成、ファインチューニング、検索、ガードレール、評価にわたる包括的な生成 AI モデル サービスを提供しており、カスタム Llama 3.1 NVIDIA NIM マイクロサービスを展開し、新しい NVIDIA NeMo Retriever マイクロサービスを使用して正確な応答を実現します。
  • Accenture は新しいサービスを使用してクライアント向けにカスタム Llama 3.1 モデルを構築する最初の企業であり、Aramco、AT&T、Uber、その他の業界リーダーが新しい Llama NVIDIA NIM マイクロサービスへ初めてアクセスしています。

カリフォルニア州サンタクララ — 2024 年 7 月 23 日 — NVIDIA は本日、同日発表されたオープン利用可能なモデルの Llama 3.1 コレクションにより、世界中の企業向けに生成 AI を強化する新しい NVIDIA AI Foundry サービスと NVIDIA NIM™ 推論マイクロサービスを発表しました。

NVIDIA AI Foundry により、企業や国家は、Llama 3.1 と NVIDIA のソフトウェア、コンピューティング、専門知識を使用して、ドメイン固有の業界ユースケース向けのカスタム「スーパーモデル」を作成できるようになりました。企業は、独自のデータだけでなく、Llama 3.1 405B や NVIDIA Nemotron™ Reward モデルから生成された合成データを使用して、これらのスーパーモデルをトレーニングすることができます。

NVIDIA AI Foundry は、世界をリードするパブリック クラウドと共同で開発された NVIDIA DGX™ Cloud AI プラットフォームを活用しており、AI の需要の変化に応じて簡単に拡張できる重要なコンピューティング リソースを企業に提供します。

この新たなサービスの提供は、企業やソブリン AI 戦略を策定している国家が、独自のビジネスや文化を反映する生成 AI アプリケーション向けに、ドメイン固有の知識を備えたカスタムの大規模言語モデルを構築するニーズに応えます。

NVIDIA の創業者/CEO であるジェンスン フアン (Jensen Huang) は次のように述べています。「Meta のオープンに利用可能な Llama 3.1 モデルは、世界中の企業における生成 AI の導入にとって極めて重要な瞬間となります。Llama 3.1 は、あらゆる企業や業界が最先端の生成 AI アプリケーションを構築するための扉を開きます。NVIDIA AI Foundry は Llama 3.1 を全面的に統合しており、企業がカスタム Llama スーパーモデルを構築し、展開するのを支援する準備ができています」

Meta の創業者/CEO である Mark Zuckerberg 氏は次のように述べています。「新しい Llama 3.1 モデルは、オープン ソース AI にとって非常に重要なステップです。NVIDIA AI Foundry を使用すると、企業は人々が望む最先端の AI サービスを簡単に作成およびカスタマイズし、NVIDIA NIM で展開することができます。これを皆さんの手に届けられることを嬉しく思います」

プロダクション AI 向けの Llama 3.1 モデルの企業展開を強化するために、Llama 3.1 モデル用の NVIDIA NIM 推論マイクロサービスが ai.nvidia.com からダウンロードできるようになりました。NIM マイクロサービスは、本番環境に Llama 3.1 モデルを展開する最も速い方法であり、NIM なしで推論を実行する場合よりも最大 2.5 倍のスループットを実現します。

企業は、Llama 3.1 NIM マイクロサービスを新しい NVIDIA NeMo Retriever NIM マイクロサービスと組み合わせて、AI コパイロット、アシスタント、デジタル ヒューマン アバター向けの最先端の検索パイプラインを作成できます。

Accenture が AI Foundry で企業向けカスタム Llama スーパーモデルを開発
世界的なプロフェッショナル サービス企業である Accentureは、自社だけでなく、文化、言語、業界を反映した生成 AI アプリケーションの展開を目指す顧客向けに、NVIDIA AI Foundry を初めて採用し、Accenture AI Refinery™ フレームワークを使用してカスタム Llama 3.1 モデルを構築しました。

Accenture の会長兼最高経営責任者 (CEO) である Julie Sweet 氏は次のように述べています。「世界の一流企業は、生成 AI があらゆる業界を変革していることを理解しており、カスタム モデルで動作するアプリケーションの展開を熱望しています。Accenture は、社内 AI アプリケーション向けに NVIDIA NIM 推論マイクロサービスと連携してきましたが、NVIDIA AI Foundry を使用することで、顧客がカスタム Llama 3.1 モデルを迅速に作成して展開し、各自のビジネス優先事項に合わせて革新的な AI アプリケーションを強化できるよう支援することができます」

NVIDIA AI Foundry は、カスタム スーパーモデルを迅速に構築するためのエンドツーエンドのサービスを提供します。NVIDIA AI Foundry は、NVIDIA のソフトウェア、インフラ、専門知識を、NVIDIA AI エコシステムのオープン コミュニティ モデル、テクノロジおよびサポートを組み合わせたものです。

NVIDIA AI Foundry を使用すると、企業は Llama 3.1 モデルと NVIDIA NeMo プラットフォームを使用してカスタム モデルを作成できます。これには、Hugging Face RewardBench で 1 位にランクされた NVIDIA Nemotron-4 340B Reward モデル が含まれます。

カスタム モデルが作成されると、企業は NVIDIA NIM 推論マイクロサービスを作成し、好みのクラウド プラットフォームとグローバル サーバー メーカーの NVIDIA-Certified Systems™ で好みの MLOps および AIOps プラットフォームを使用して本番環境で実行することができます。

NVIDIA AI Enterprise の専門家とグローバル システム インテグレーター パートナーは、AI Foundry の顧客と協力して、開発から展開まで、プロセス全体を加速します。

NVIDIA Nemotron が高度なモデル カスタマイズを強化
ドメイン固有のモデルを作成するために追加のトレーニング データが必要な企業は、Llama 3.1 405B と Nemotron-4 340B を併用して合成データを生成し、カスタム Llama スーパーモデルを作成するときにモデルの精度を高めることができます。

独自のトレーニング データを持つ顧客は、ドメイン適応型事前トレーニング (DAPT) 用にNVIDIA NeMoを使用して Llama 3.1 モデルをカスタマイズし、モデルの精度をさらに高めることができます。

NVIDIA と Meta は、Llama 3.1 の蒸留レシピの提供でも協力しており、開発者はこれを使用して、生成 AI アプリケーション用のより小規模なカスタム Llama 3.1 モデルを構築できます。これにより、企業は AI ワークステーションやノート PC などのより広範なアクセラレーテッド インフラで Llama 搭載の AI アプリケーションを実行可能になります。

業界をリードする企業が NVIDIA と Llama で AI を強化
ヘルスケア、エネルギー、金融サービス、小売、運輸、通信の分野の企業は、すでに Llama 向けの NVIDIA NIM マイクロサービスに取り組んでいます。Llama 3.1 向けの新しい NIM マイクロサービスに最初にアクセスした企業の中には、Aramco、AT&T、および Uber があります。

16,000 基を超える NVIDIA H100 Tensor コア GPU でトレーニングされ、データセンター、クラウド、および NVIDIA RTX™ GPU を搭載したワークステーションや GeForce RTX GPU を搭載した PC 上のローカルで NVIDIA アクセラレーテッド コンピューティングとソフトウェア向けに最適化された Llama 3.1 多言語 LLM コレクションは、8B、70B、および 405B のパラメータ サイズの生成 AI モデルのコレクションです。

新しい NeMo Retriever RAG マイクロサービスが精度とパフォーマンスを向上
組織は、RAG (検索拡張生成) 用の新しい NVIDIA NeMo Retriever NIM 推論マイクロサービスを使用することで、カスタマイズされた Llama スーパーモデルと Llama NIM マイクロサービスを本番環境に展開する際の応答精度を高めることが可能になります。

Llama 3.1 405B 向け NVIDIA NIM 推論マイクロサービスと組み合わせることで、NeMo Retriever NIM マイクロサービスは、RAG パイプラインで最高のオープンおよび商用テキスト Q&A 検索精度を実現します。

Llama 3.1 および NeMo Retriever NIM の展開をサポートするエンタープライズ エコシステム
エンタープライズ、データ、インフラのプラットフォームを提供する何百もの NVIDIA NIM パートナーは、新しいマイクロサービスを AI ソリューションに統合して、500 万人を超える開発者と 19,000社のスタートアップからなる NVIDIA コミュニティ向けに生成 AI を強化できるようになりました。

Llama 3.1 NIM および NeMo Retriever NIM マイクロサービスのプロダクション サポートは、NVIDIA AI Enterprise を通じて利用できます。NVIDIA Developer Program のメンバーは、まもなく NIM マイクロサービスに無料でアクセスして、好みのインフラ上で研究、開発、テストを行うことができます。

NVIDIA について
1993年の創業以来、NVIDIA(https://www.nvidia.com/ja-jp/)(NASDAQ: NVDA) はアクセラレーテッド コンピューティングのパイオニアです。同社が 1999 年に発明した GPU は、PC ゲーム市場の成長を促進し、コンピューター グラフィックスを再定義して、現代の AI の時代に火をつけながら、各種産業のデジタル化を後押ししています。NVIDIA は現在、業界を再形成しているデータセンター規模の製品を提供するフルスタック コンピューティング企業です。詳細は、こちらのリンクから:https://nvidianews.nvidia.com/

本プレスリリースに含まれる特定の記述には、以下のような記述が含まれますが、これらに限定されるものではありません:NVIDIA AI Foundry、NVIDIA Nemotronモデル、NVIDIA Nemotron-4モデル、NVIDIA DGX Cloud、NVIDIA NeMo Retriever NIMマイクロサービス、NVIDIA NeMoプラットフォーム、NVIDIA-Certified Systems、NVIDIA Tensor コア GPU、NVIDIA RTX GPUsおよびGeForce RTX GPUsを含む、NVIDIAの製品および技術の利点、影響、性能、特徴および利用可能性; 第三者によるNVIDIA製品、技術およびプラットフォームの使用または採用、およびその利点と影響、第三者との協力、およびその利点と影響、Llama 3. 1 は、最先端の生成AI アプリケーションを構築するための扉をあらゆる企業や業界に開くものであり、NVIDIA AI Foundry は、企業がカスタム Llama スーパーモデルを構築し、展開するのを支援する準備が整っていることなど、本プレスリリースにおける一定の記載は、将来予測的なものが含まれており、予測とは著しく異なる結果を生ずる可能性があるリスクと不確実性を伴っています。かかるリスクと不確実性は、世界的な経済環境、サードパーティに依存する製品の製造、組立、梱包、試験、技術開発および競合による影響、新しい製品やテクノロジの開発あるいは既存の製品やテクノロジの改良、NVIDIA 製品や協業企業の製品の市場への浸透、デザイン、製造あるいはソフトウェアの欠陥、ユーザーの嗜好および需要の変化、業界標準やインターフェイスの変更、システム統合時に NVIDIA 製品および技術の予期せぬパフォーマンスにより生じる損失などを含み、その他のリスクの詳細に関しては、Form 10-K での NVIDIA のアニュアル レポートならびに Form 10-Q での四半期レポートなど、米証券取引委員会 (SEC) に提出されている NVIDIA の報告書に適宜記載されます。SEC への提出書類は写しが NVIDIA の Web サイトに掲載されており、NVIDIA から無償で入手することができます。これらの将来予測的な記述は発表日時点の見解に基づくものであって将来的な業績を保証するものではなく、法律による定めがある 場合を除き、今後発生する事態や環境の変化に応じてこれらの記述を更新する義務を NVIDIA は一切負いません。

本リリースに記載されている製品や機能の多くはまだ様々な段階にあり、利用可能になった時点で提供される予定です。上記の記述は、コミットメント、約束、または法的義務として意図されたものではなく、またそのように解釈されるべきでもありません。また、NVIDIA 製品についての説明に含まれる特徴や機能の開発、リリースおよび時期は変更される可能性があり、NVIDIAの単独の裁量に委ねられます。NVIDIAは、ここに記載された製品、特徴または機能の不達または遅延について、いかなる責任も負いません。

© 2024 NVIDIA Corporation. 無断複写・転載を禁じます。NVIDIA、NVIDIA ロゴ、DGX、NVIDIA Certified-Systems、NVIDIA Nemotron、 NVIDIA NIM およびNVIDIA RTX は、米国およびその他の国における NVIDIA Corporation の商標および/または登録商標です。その他の会社名および製品名は、関連する各社の商標である場合があります。機能、価格、可用性および仕様は予告なく変更されることがあります。