NVIDIA NeMo サービス

ハイパーパーソナライゼーションとインテリジェントな大規模言語モデルの大規模展開のための企業向けクラウドサービス。

概要
製品の機能
メリット
関連情報
早期アクセス

概要

概要
製品の機能
メリット
関連情報
早期アクセス

NVIDIA AI Foundations の一部である NVIDIA NeMo™ は、企業による迅速なAI導入を可能にする高度にパーソナライズされたクラウドサービスです。最先端の基盤モデル、カスタマイズツール、大規模な展開を提供します。運用領域の定義、新しいドメイン固有の知識のエンコード、専門スキルの追加によって、継続的にアプリケーションを洗練します。

クラウド API を活用し、ジェネレーティブ AI 機能を企業アプリケーションに迅速かつ容易に統合することができます。

ジェネレーティブ AI の活用

独自の言語モデルを構築し、インテリジェントな企業向けジェネレーティブ AI アプリケーションに展開することができます。

コンテンツ生成

マーケティングコンテンツ
製品説明生成

要約

法的解釈
議事録の要約

チャットボット

質問と回答
カスタマーサービスエージェント

情報検索

文章における一節の検索とランキング
文書の類似性

翻訳

言語からコードへ
言語から言語へ

最先端の AI 基盤モデル

大規模言語モデル (LLM) の開発や保守には、膨大なデータ、多額の設備投資、技術的専門知識、大規模な計算インフラが必要であり、それは大変な作業です。

企業は、学習済みの基盤モデルから始めることで、大規模言語モデルの導入をすぐにスタートすることができます。

The 5 NeMo Generative AI Foundation Models

5 つの NeMo ジェネレーティブ AI 基盤モデル

GPT-8:

80 億のパラメーターで、教師による微調整が可能。1.1 兆個のトークン、4,000 個のトークンのシーケンス長で学習。
シンプルなタスクでアプリケーションのサービス品質保証を満たす、高速なレスポンスを提供。
使用例: テキスト分類、スペル修正

GPT-43:

430 億のパラメーターで、教師による微調整が可能。50 以上の言語をサポート。1.1兆個のトークン、4,000 個のトークンのシーケンス長で学習。
高精度と低遅延の最適なバランスを提供。
使用例: E メールの作成、事実に基づくQ&A

GPT-530:

5,300 億のパラメーターで、教師ありの微調整が可能。3,400 億のトークン、2,000 個のトークンのシーケンス長で学習。
人間の言語とそのニュアンスを深く理解する必要がある複雑なタスクに最適。
使用例: テキスト要約、クリエイティブライティング、チャットボット

Inform:

最新の独自知識が必要な業務に最適。
使用例: 企業情報、情報探索、Q&A

mT0-xxl:

100 以上の言語をサポートする130 億のパラメーターを持つコミュニティが構築したモデルで、教師による微調整も可能。2,000個のトークンのシーケンス長でトレーニング済み。
使用例: 言語翻訳、言語理解、Q&A

企業でカスタマイズするための厳選された手法

基盤モデルは、すぐに使える素晴らしいものではありますが、特定の企業のタスクに役立つようにするのは容易ではありません。一般に公開されている情報に基づいてトレーニングされ、ある時点で時間が止まっていて、迷いを起こさせ、偏った情報や有害な情報を含んでいます。

企業は、特定のユースケースに合わせて基盤モデルをカスタマイズする必要があります。

1 焦点を定義する

大規模言語モデルが不要な領域に踏み込んだり、不適切な発言をしたりしないように、微調整やプロンプトラーニング技術によって、エンタープライズモデルの操作領域を定義し、ガードレールを追加します。

2 知識を追加する

Inform を使って企業のリアルタイム情報を AI にエンコードして埋め込み、最新のレスポンスを提供します。

3 スキルを追加する

顧客やビジネスの問題を解決するために、専門的なスキルを追加します。プロンプトラーニング技術を使って特定のユースケースの文脈を提供することで、より良いレスポンスを得ることができます。

4 改善し続ける

強化学習と人間のフィードバック (RLHF) 技術により、エンタープライズモデルは人間の意図に沿うように、時間とともに賢くなることができます。

インテリジェントな言語アプリケーションをより迅速に構築

簡単にカスタマイズ

企業のハイパーパーソナライゼーションに対応した厳選のトレーニング技術

より高い精度を実現

最大 1 兆個のトークンでトレーニングした、カスタマイズ可能な業界最高レベルの AI 基盤モデル群

どこでも実行

大規模なカスタムモデルの推論をサービス内で実行したり、NVIDIA AI Enterprise ソフトウェアでクラウドやプライベートデータセンター全体に展開可能

大規模で最速の処理性能

NVIDIA DGX™ Cloud を活用した最先端のトレーニング技術、ツール、推論

使い易さ

数行のコードや直感的な GUI ベースのプレイグラウンドを通じて、独自のエンタープライズ大規模言語モデルの機能に簡単にアクセス可能

企業向けサポート

NVIDIA の AI 専門家があらゆる段階で完全サポート

さまざまな業界で採用

製品の機能詳細

お好みの基本モデルを選択してください。

Customize your choice of various NVIDIA or community-developed models that work best for your AI applications.

Accelerate customization.

Within minutes to hours, get better responses by providing context for specific use cases using prompt learning techniques. See NeMo prompt learning documentation.

Experience Megatron 530B.

Leverage the power of NVIDIA Megatron 530B, one of the largest language models, through the NeMo LLM Service.

Develop seamlessly across use cases.

Take advantage of models for drug discovery, included in the cloud API and NVIDIA BioNeMo framework.

NeMo サービスの早期アクセス

ハイパーパーソナライゼーションとインテリジェントな大規模言語モデルの大規模な展開を提供する企業向けクラウドサービスを今すぐお試しください。

早期アクセスに申し込む