概要

AI 推論とは?

AI 推論とは、学習済みの AI モデルをデプロイして新しいデータを生成し、AI が結果を提供するよう導くプロセスです。これにより、あらゆる業界でイノベーションを推進します。AI モデルは、規模、複雑さ、多様性の点で急速に拡大し、可能性の限界を押し広げています。企業が AI 推論をうまく活用するためには、エンドツーエンドの AI ライフサイクルをサポートするフルスタックのアプローチと、各チームの目標達成を可能にするツールが必要です。

本番環境に生成 AI をデプロイ

本番環境に生成 AI をデプロイしたり規模を拡大したりする場合に、考慮しなければならない重要なポイントについて、AI 推論の重要な役割を含めて詳しくご覧ください。

利点

推論を高速化するための NVIDIA AI の利点について知る

デプロイの標準化

デプロイの標準化

あらゆるアプリケーション、AI フレームワーク、モデル アーキテクチャ、プラットフォーム間で、モデルのデプロイを標準化します。

統合と拡張を簡単に

統合と拡張を簡単に

パブリック クラウド、オンプレミス データ センター、エッジで、ツールやプラットフォームと簡単に統合できます。

コスト削減

コスト削減

AI インフラストラクチャから優れたスループットと稼働率を実現し、コストを削減します。

高性能

高性能

AI の主要な業界ベンチマークである MLPerf で複数の記録を絶えず打ち立てているプラットフォームで、業界をリードするパフォーマンスを体験できます。

ソフトウェア

AI 推論ソフトウェアの詳細を見る

NVIDIA AI Enterprise は、NVIDIA NIM™NVIDIA Triton™ Inference ServerNVIDIA® TensorRT™、およびその他のツールで構成されており、AI アプリケーションの構築、共有、デプロイを簡素化します。エンタープライズ グレードのサポート、安定性、管理性、セキュリティにより、企業は計画外のダウンタイムを排除しながら、価値を生み出すまでにかかる時間を短縮できます。

NVIDIA NIM - 生成 AI を即座にデプロイ

生成 AI 推論への最短の道

NVIDIA NIM は、クラウド、データ センター、ワークステーションにまたがって、高性能な AI モデル推論を安全かつ確実にデプロイするように設計された、使いやすいマイクロサービスです。

すべての AI ワークロードに適した NVIDIA Triton Inference Server

すべての AI ワークロードに対応する統合型の推論

NVIDIA Triton Inference Server は、オープンソースの推論サービング ソフトウェアです。企業がカスタマイズされた AI モデルのサービング インフラを統合し、新たな AI モデルを本番環境に展開する時間を短縮するのに役立ち、AI 推論と予測能力を高めます。

NVIDIA TensorRT

推論とランタイムを最適化する SDK

NVIDIA TensorRT には、推論ランタイムとモデル最適化が含まれており、本番環境アプリケーションに低遅延と高スループットを提供します。TensorRT エコシステムには、TensorRT、TensorRT-LLM、TensorRT Model Optimizer、TensorRT Cloud が含まれます。

ハードウェア

AI 推論インフラストラクチャの詳細を見る

NVIDIA で高速化したインフラストラクチャ向けに最適化された NVIDIA AI 推論ソフトウェアを使用すれば、比類のない AI パフォーマンスが手に入ります。NVIDIA Blackwell、H200、L40S、NVIDIA RTX™ テクノロジは、データ センター、クラウド、ワークステーション全体にわたって AI 推論ワークロードに優れたスピードと効率を提供します。

NVIDIA Blackwell プラットフォーム

NVIDIA Blackwell プラットフォーム

NVIDIA Blackwell アーキテクチャは、生成 AI とアクセラレーテッド コンピューティングの次の発展を特徴づけるものであり、比類のないパフォーマンス、効率性、拡張性を備えています。 Blackwell は、データ処理、電子設計自動化、コンピュータ支援エンジニアリング、量子コンピューティングにおいて画期的な進歩をもたらす 6 つの変革的なテクノロジを備えています。

H200 が生成 AI を強化

NVIDIA H200 Tensor コア GPU

NVIDIA H200 Tensor コア GPU は、市場を一変させるパフォーマンスとメモリ機能で生成 AI と高パフォーマンス コンピューティング (HPC) ワークロードを強化します。H200 は HBM3e を搭載した初の GPU であり、この大容量かつ高速なメモリが、HPC ワークロードで科学計算処理を進化させる一方で、生成 AI と大規模言語モデル (LLM) を大幅に高速化します。

NVIDIA L40S GPU

NVIDIA L40S GPU

NVIDIA の推論サービング ソフトウェアのフルスタックと L40S GPU を組み合わせることで、推論用にトレーニングされたモデルに適した強力なプラットフォームが実現します。構造化されたスパース性と幅広い精度をサポートする L40S は、NVIDIA A100 Tensor コア GPU の最大 1.7 倍の推論性能を発揮します。

NVIDIA RTX テクノロジ、AI をビジュアル コンピューティングで実現

NVIDIA RTX テクノロジ

NVIDIA RTX テクノロジは、ビジュアル コンピューティングに AI をもたらし、タスクを自動化して計算負荷の高いプロセスを最適化することで創造性を高速化します。CUDA® コアの強力な機能により、RTX はリアルタイムのレンダリング、AI、グラフィックス、コンピューティング性能を向上させます。

NVIDIA Project DIGITS の登場

NVIDIA Project DIGITS は、Grace Blackwell のパワーを開発者のデスクトップにもたらします。GB10 Superchip と 128GB の統合システム メモリを組み合わせることで、AI 研究者、データ サイエンティスト、学生は、最大 2,000 億のパラメーターの AI モデルをローカルで実行することができます。

ユース ケース

AI 推論の活用法

NVIDIA AI がさまざまな業界でどのように活用されているのかをご覧ください。厳選された使用事例を参考にして AI 開発をぜひ開始してください。

デジタル ヒューマン

NVIDIA ACE は、開発者がデジタル ヒューマンに命を吹き込むのに役立つテクノロジーのスートです。その中の複数の ACE マイクロサービスは NVIDIA NIM であり、NVIDIA RTX AI PC や 100 カ国に低遅延のデジタル ヒューマン処理を提供する GPU のグローバル ネットワークである NVIDIA Graphics Delivery Network (GDN) で動作するように最適化された、デプロイが容易な高パフォーマンス マイクロサービスです。 

生成 AI でデジタル アバターを作成する

お客様の事例

業界のリーダーが AI 推論でイノベーションを推進している方法

NVIDIA DGX Cloud を活用した通信事業者向け AI プラットフォーム
Amdocs

生成 AI の性能を高速化し、コストを削減

Amdocs が amAIz を構築するまでの過程をご覧ください、amAIz は通信業者向けのドメイン固有の生成 AI プラットフォームであり、NVIDIA DGX™ Cloud と NVIDIA NIM 推論マイクロサービスを使用することで、遅延を改善し、正確性を大きく向上させ、コストを削減します。

Triton Inference による光学文字認識
Snapchat

衣料品購買を AI で強化

Snapchat が、Triton Inference Server を使用することで、どのようにして衣料品のショッピング体験と絵文字を認識する光学文字認識を強化し、規模の拡大、コスト削減、本番環境までの時間短縮を実現したのかをご覧ください。

TensorRT を使用して推論を 5 倍に高速化
Amazon

顧客満足度の向上

Amazon が TensorRT を使用することで、どのようにして推論を 5 倍に高速化し顧客満足度を改善したのかをご覧ください。

関連情報

AI 推論リソースの最新情報

高速かつ低コストの推論が、収益性の高い AI の鍵となる
March 11, 2025
今年はあらゆる業界の企業が、AI サービスを展開しています。Microsoft、Oracle、Perplexity、Snap、その他の数百社に及ぶ大手企業にとっては、世界トップクラスの半導体、システム、ソフトウェアで構成 続きを読む The post 高速かつ低コストの推論が、収益性の高い AI の鍵となる appeared first on NVIDIA | Japan Blog.
よりスマートで強力な AI をスケーリング則によって実現する方法
February 28, 2025
一般に広く理解されている自然界の経験則で、たとえば、「上がったものは必ず下りてくる」、「すべての作用は等しい逆向きの反作用を生む」といったものがあるように、AI の分野でも長い間、単一の考え方が主流を占めてきました。すな 続きを読む The post よりスマートで強力な AI をスケーリング則によって実現する方法 appeared first on NVIDIA | Japan Blog.
日本が次世代の医薬品設計、ヘルスケア ロボット、デジタル ヘルス プラットフォームを開発
November 13, 2024
製薬会社、医療技術会社、学術研究者が医薬品の発見、ゲノム科学の加速、医療機器の推進を目的としたソブリン AI 機能を開発中 65 歳以上の高齢者が人口の 30% を占める日本は、質の高い医療を提供するために、医療のほぼす 続きを読む The post 日本が次世代の医薬品設計、ヘルスケア ロボット、デジタル ヘルス プラットフォームを開発 appeared first on NVIDIA | Japan Blog.

次のステップ

さっそく始めませんか?

最新のドキュメント、チュートリアル、技術ブログなど、AI アプリケーション開発を始めるために必要な情報をすべてご覧ください。

お問い合わせ

お問い合わせ

NVIDIA AI Enterprise のセキュリティ、API の安定性、サポートを利用した、パイロットから本番環境への移行については、NVIDIA 製品スペシャリストにご相談ください。

NVIDIA AI の最新情報を

NVIDIA AI の最新情報

NVIDIA から最新ニュース、アップデートなどの情報をお送りします。

次のステップ

さっそく始めませんか?

最新のドキュメント、チュートリアル、技術ブログなど、AI アプリケーション開発を始めるために必要な情報をすべてご覧ください。

お問い合わせ

NVIDIA AI Enterprise のセキュリティ、API の安定性、サポートを利用した、パイロットから本番環境への移行については、NVIDIA 製品スペシャリストにご相談ください。

NVIDIA AI の最新情報

NVIDIA から最新ニュース、アップデートなどの情報をお送りします。

Select Location
Middle East