NVIDIA-Accelerated Data Science

The only hardware-to-software stack optimized for data science.

特徴
ソリューション
インフォグラフィック
RAPIDS
パートナー

特徴
ソリューション
インフォグラフィック
RAPIDS
パートナー

GPU によりデータサイエンスワークフローを高速化

従来、データサイエンスのワークフローは、データの読み込み、フィルター処理、操作、さらにはモデルのトレーニングと実装において CPU に依存しており、遅くて扱いにくいものでした。GPU は設備費用を大幅に抑え、NVIDIA RAPIDS™ ライブラリを利用し、データサイエンスのエンドツーエンドワークフローに優れたパフォーマンスを提供します。デスクトップ、データセンター、エッジ、クラウドなど、さまざまな場所で GPU アクセラレーテッドデータサイエンスを利用できます。

特徴と利点

生産性の最大化

重要な洞察を得る時間を短縮し、ROI を高速化します。

成果の向上

機械学習のトレーニングを最大 215 倍高速化することにより、より多くの反復の実行や実験を増やし、さらに詳細な調査を実行します。

費用効率

データサイエンスの設備費用を削減し、データセンター効率を向上させます。

RAPIDS による Apache Spark 3.0 の GPU アクセラレーション

Apache Spark 3.0 は、分析と AI のワークロードのために完全統合されたシームレスな GPU アクセラレーションを提供する最初の Spark リリースです。オンプレミスでも、クラウドでも、コードを変更することなく GPU を利用して Spark 3.0 のパワーを活用できます。GPU の画期的な性能は、企業や研究者がより大きなモデルをより頻繁にトレーニングできるようになり、AI のパワーでビッグデータから価値を引き出すことができるようになります。

詳細を見る

150X

Faster Pandas with cuDF

* Benchmark on Groupy advanced operation (5GB) DuckDB Data Benchmark
HW: Intel Xeon Platinum 8480CL CPU and NVIDIA Grace Hopper™ GPU
SW: pandas v1.5 and cudf.pandas v23.10

5X

Faster Spark with the RAPIDS Accelerator for Spark

* NDS 2.0 benchmarks were run with parquet decimal data @ SF3K with UCX off

CPU-only: 8x n1-standard-32

GPU: 8x g2-standard-16, 8x L4 24GB
SW: Spark RAPIDS 24.02

48X

Faster NetworkX with cuGraph

* Benchmark on PageRank with synthetic dataset having ~16,384 vertices and ~524,288 edges
HW: Intel Xeon Platinum 8480CL CPU and NVIDIA H100 80GB (1x GPU)
SW: NetworkX v3.2 and cuGraph v23.10

NVIDIA GPU で XGBOOST トレーニング

GPU 対応 XGBoost は、単一ノードと分散型配置の両方で世界をリードする機械学習アルゴリズムに画期的なパフォーマンスをもたらします。CPU を大幅に上回るトレーニングスピードにより、データサイエンスチームはより大規模なデータセットに取り組み、より高速に反復処理を行い、モデルを調整して予測精度とビジネス価値を最大化できます。

データ準備

XGBoost

エンドツーエンド

CPU: Core i9 | End-to-end time = Data Prep + Conversion + Training + Validation

GPU対応 XGBoost を今すぐ使い始める方法をご紹介します。

今すぐ始める

データサイエンス向け NVIDIA GPU ソリューション

さまざまな NVIDIA GPU ソリューションで比類のない高速化を体験してください。

PC

機械学習を開始しましょう。

詳細を見る

ワークステーション

データサイエンス向けの新しいワークステーション。

詳細を見る

データセンター

企業の生産向け AI システム。

詳細を見る

>クラウド

あらゆる用途に高速化された機械学習。

詳細を見る

GPU を活用したビジネス事例

機械学習ワークフローのパフォーマンス、生産性、および ROI を最大化します。

RAPIDS: データサイエンスライブラリスイート

NVIDIA CUDA-X AI 上で構築された RAPIDS は、NVIDIA® CUDA® の 15 年以上に及ぶ開発と機械学習のノウハウを活用しています。このパワフルなソフトウェアにより、エンドツーエンドのデータサイエンストレーニングパイプラインは GPU 内で完全に処理され、トレーニング時間が日単位から分単位に短縮されます。

ソースコードをダウンロード

NGC コンテナーをダウンロード

RAPIDS, a GPU-accelerated data science platform, is a next-generation computational ecosystem powered by Apache Arrow. The NVIDIA collaboration with Ursa Labs will accelerate the pace of innovation in the core Arrow libraries and help bring about major performance boosts in analytics and feature engineering workloads.

- Wes McKinney, Head of Ursa Labs and Creator of Apache Arrow and Pandas

I got 24x speedup using RAPIDS XGBOOST and can now replace hundreds of CPU nodes, running my biggest ML workload on a single node with 8 GPUs. You made XGBOOST too fast!?

- Streaming Media Company

My previous bottleneck was I/O. …10 minutes to pull in data for 10 stores (about 1 million rows). With RAPIDS, we can pull in data for about 6000 stores (millions of rows) in less than 3 minutes. That scale could have easily taken us 4 days on legacy infrastructure … just plain awesome.

- A mid-market specialty retailer with 6000 stores