NVIDIA NeMo サービス

ハイパーパーソナライゼーションとインテリジェントな大規模言語モデルの大規模展開のための企業向けクラウド サービス。

NVIDIA AI Foundations の一部である NVIDIA NeMo™ は、企業による迅速なAI導入を可能にする高度にパーソナライズされたクラウドサービスです。最先端の基盤モデル、カスタマイズ ツール、大規模な展開を提供します。運用領域の定義、新しいドメイン固有の知識のエンコード、専門スキルの追加によって、継続的にアプリケーションを洗練します。

クラウド API を活用し、ジェネレーティブ AI 機能を企業アプリケーションに迅速かつ容易に統合することができます。

ジェネレーティブ AI の活用

独自の言語モデルを構築し、インテリジェントな企業向けジェネレーティブ AI アプリケーションに展開することができます。

コンテンツ生成

  • マーケティング コンテンツ
  • 製品説明生成

要約

  • 法的解釈
  • 議事録の要約

チャットボット

  • 質問と回答
  • カスタマー サービス エージェント

情報検索

  • 文章における一節の検索とランキング
  • 文書の類似性

分類

  • 毒性分類器
  • 顧客セグメンテーション

翻訳

  • 言語からコードへ
  • 言語から言語へ

最先端の AI 基盤モデル

大規模言語モデル (LLM) の開発や保守には、膨大なデータ、多額の設備投資、技術的専門知識、大規模な計算インフラが必要であり、それは大変な作業です。   

企業は、学習済みの基盤モデルから始めることで、大規模言語モデルの導入をすぐにスタートすることができます。

The 5 NeMo Generative AI Foundation Models

5 つの NeMo ジェネレーティブ AI 基盤モデル

GPT-8:

  • 80 億のパラメーターで、教師による微調整が可能。1.1 兆個のトークン、4,000 個のトークンのシーケンス長で学習。
  • シンプルなタスクでアプリケーションのサービス品質保証を満たす、高速なレスポンスを提供。
  • 使用例: テキスト分類、スペル修正

GPT-43:

  • 430 億のパラメーターで、教師による微調整が可能。50 以上の言語をサポート。1.1兆個のトークン、4,000 個のトークンのシーケンス長で学習。
  • 高精度と低遅延の最適なバランスを提供。
  • 使用例: E メールの作成、事実に基づくQ&A

GPT-530:

  • 5,300 億のパラメーターで、教師ありの微調整が可能。3,400 億のトークン、2,000 個のトークンのシーケンス長で学習。
  • 人間の言語とそのニュアンスを深く理解する必要がある複雑なタスクに最適。
  • 使用例: テキスト要約、クリエイティブ ライティング、チャットボット

Inform:

  • 最新の独自知識が必要な業務に最適。
  • 使用例: 企業情報、情報探索、Q&A

mT0-xxl:

  • 100 以上の言語をサポートする130 億のパラメーターを持つコミュニティが構築したモデルで、教師による微調整も可能。2,000個のトークンのシーケンス長でトレーニング済み。
  • 使用例: 言語翻訳、言語理解、Q&A

企業でカスタマイズするための厳選された手法

基盤モデルは、すぐに使える素晴らしいものではありますが、特定の企業のタスクに役立つようにするのは容易ではありません。一般に公開されている情報に基づいてトレーニングされ、ある時点で時間が止まっていて、迷いを起こさせ、偏った情報や有害な情報を含んでいます。

企業は、特定のユース ケースに合わせて基盤モデルをカスタマイズする必要があります。

1 焦点を定義する

大規模言語モデルが不要な領域に踏み込んだり、不適切な発言をしたりしないように、微調整やプロンプト ラーニング技術によって、エンタープライズ モデルの操作領域を定義し、ガードレールを追加します。

2 知識を追加する

Inform を使って企業のリアルタイム情報を AI にエンコードして埋め込み、最新のレスポンスを提供します。

3 スキルを追加する

顧客やビジネスの問題を解決するために、専門的なスキルを追加します。プロンプト ラーニング技術を使って特定のユース ケースの文脈を提供することで、より良いレスポンスを得ることができます。

4 改善し続ける

強化学習と人間のフィードバック (RLHF) 技術により、エンタープライズ モデルは人間の意図に沿うように、時間とともに賢くなることができます。

インテリジェントな言語アプリケーションをより迅速に構築

NeNo is Customizable

簡単にカスタマイズ

企業のハイパーパーソナライゼーションに対応した厳選のトレーニング技術

Amazingly Accurate

より高い精度を実現

最大 1 兆個のトークンでトレーニングした、カスタマイズ可能な業界最高レベルの AI 基盤モデル群

NVIDIA AI Enterprise software

どこでも実行

大規模なカスタム モデルの推論をサービス内で実行したり、NVIDIA AI Enterprise ソフトウェアでクラウドやプライベート データセンター全体に展開可能

NVIDIA DGX Cloud.

大規模で最速の処理性能

NVIDIA DGX™ Cloud を活用した最先端のトレーニング技術、ツール、推論

NEMO-Ease of Use

使い易さ

数行のコードや直感的な GUI ベースのプレイグラウンドを通じて、独自のエンタープライズ大規模言語モデルの機能に簡単にアクセス可能

NVIDIA AI Experts

企業向けサポート

NVIDIA の AI 専門家があらゆる段階で完全サポート

さまざまな業界で採用

製品の機能詳細

A Network of Foundation Models

お好みの基本モデルを選択してください。

Customize your choice of various NVIDIA or community-developed models that work best for your AI applications.

Customize Faster than Ever

Accelerate customization.

Within minutes to hours, get better responses by providing context for specific use cases using prompt learning techniques. See NeMo prompt learning documentation.

 Leverage the Power of Megatron

Experience Megatron 530B.

Leverage the power of NVIDIA Megatron 530B, one of the largest language models, through the NeMo LLM Service.

Seamless Development

Develop seamlessly across use cases.

Take advantage of models for drug discovery, included in the cloud API and NVIDIA BioNeMo framework.

関連情報

NeMo のデモ

Procter & Gamble 社が NeMo サービスを利用して、オペレーターの生産性を向上させ、マシンのシャットダウンを最小限に抑えている事例をご覧ください。

GTC 2023 基調講演

NVIDIA AI Foundations、NeMo フレームワークなど、GTC 基調講演でご確認ください。

LLM ベースの AI アプリケーションへの高速パス

数千億のパラメーターを持つカスタマイズされた大規模言語モデルを含む AI アプリケーションを開発する方法を学びます。p-tuning のような最先端の技術により、特定のユース ケース向けに大規模言語モデルをカスタマイズすることができます。

NeMo サービスの早期アクセス

ハイパーパーソナライゼーションとインテリジェントな大規模言語モデルの大規模な展開を提供する企業向けクラウド サービスを今すぐお試しください。

関連製品

BioNemo

BioNeMo is an application framework built on NVIDIA NeMo Megatron for training and deploying large biomolecular transformer AI models at supercomputing scale.

NeMo Megatron

NVIDIA NeMo Megatron is an end-to-end framework for training and deploying LLMs with billions and trillions of parameters.

Select Location
Middle East