ハイパフォーマンス データ分析

大規模なデータセットで反復作業を行い、モデルをデプロイする頻度を増やし、総所有コストを下げましょう。

従来のデータ分析ワークフローは、データの準備、トレーニング、デプロイを CPU 演算に依存していて、時間がかかり、面倒でした。アクセラレーテッド データ サイエンスでは、エンドツーエンドの分析ワークフローのパフォーマンスを劇的に高め、価値創出の時間を短縮し、同時にコストを削減することが可能です。

変革を起こすテクノロジによって短期間で結果を出す

業界の課題

  • データの準備は複雑で時間のかかるプロセスです。データ サイエンティストがその時間の大部分を費やす必要があります。

  • 反復作業には相当な時間がかかり、それによって分析の堅牢性が下がります。

  • データセットをダウンサンプリングすると、最適な結果を得られません。

企業は分析を活用することでデータを理解し、意思決定を推し進めます。データ分析はこれまで大きな可能性を解放してきましたが、従来の CPU ベースのデータ処理および分析ではオーバーヘッドが増え、企業経営が複雑になり、投資利益率が下がります。アクセラレーテッド データ サイエンスが新時代のデータ分析をもたらします。組織や実務者はそのデータやインフラストラクチャを最大限まで活用することが可能です。

アクセラレーテッド データ サイエンスにより、エンドツーエンドのデータ分析ワークフローが改善されます。企業で利用するためにデータを変換したり、特定の問題領域を理解する目的でテラバイト規模のデータをビジュアライゼーションしたりできます。データ実務者はお気に入りのツールセットで簡単に NVIDIA GPU を活用できます。最小限の学習曲線でハイパフォーマンス コンピューティングのパワーを組織にもたらしましょう。

ハイパフォーマンス データ分析の力を利用すれば、企業はより良いサービスを顧客に提供し、製品をより短期間で開発し、企業全体でイノベーションを起こすことができます。

ビッグ データに対する超高速パフォーマンス

GPU は規模にかかわらず、ビッグ データ分析問題のコストを劇的に削減し、時間を大幅に節約するという結果が出ています。RAPIDS では Pandas や Dask などの一般的な API を使用しており、GPU により 10 テラバイトの規模で最上位 CPU の最大 20 倍高速なパフォーマンスを実現します。わずか 16 基の NVIDIA DGX A100 で CPU ベースのサーバー 350 台分のパフォーマンスを達成する NVIDIA のソリューションは、7 倍以上の費用対効果で HPC レベルのパフォーマンスを実現します。

ブログを読む

Lightning-Fast Performance on Big Data

高速分析の利点

  • データ サイエンティスト
  • データ エンジニア
  • IT および DevOps プロフェッショナル
プロセス完了までの待ち時間が減る

待ち時間の短縮

プロセス完了までの待ち時間が減り、ビジネス上の差し迫った問題に対するソリューションを反復およびテストするための時間が増えます。

マルチテラバイト データセットと高性能処理

結果の改善

高性能処理でマルチテラバイトのデータセットを分析することで、結果の精度が上がり、報告が早くなります。

リファクタリング不要 - 既存のデータ サイエンス ツールチェーンを拡張する

リファクタリング不要

既存のデータ サイエンス ツールチェーンを高速化および拡張します。新しいツールを覚える必要がないうえに、コードの変更は最小限で済みます。

高品質のデータセットをより短時間で提供し、実務者を支援する

処理の高速化

大規模なデータを迅速に変換して、高品質のデータセットをより短時間で生成できます。組織全体で実務者と業務を支援できます。

普及している多くの分析ライブラリの間でデバイス メモリを簡単に共有する

広範な相互運用性

普及している多くの分析ライブラリの間でデバイス メモリを簡単に共有可能です。コストと時間がかかるコピー操作を回避できます。

データ形式を活用する

再フォーマット不要

ファイルの形式変換に多大な時間をかけるのはやめにしましょう。組織に最適なデータ形式を活用してください。

GPU アクセラレーションで予算を最大限に活用する

支出の削減

より多くの CPU を購入、デプロイ、管理してコストを増やすのではなく、GPU アクセラレーションで予算を最大限に活用しましょう。

あらゆるデータを活用し、ビジネスにおける意思決定を改善する

意思決定の改善

あらゆるデータを活用することでビジネスにおいて最良の意志決定を行い、組織のパフォーマンスを改善し、顧客のニーズを今までより効果的に満たします。

デスクトップからマルチノードに簡単にスケールする

シームレスなスケーリング

一貫性のある直観的なアーキテクチャでデスクトップからマルチノード、マルチ GPU クラスターまで簡単にスケールできます。

NVIDIA による エンドツーエンドの高速分析

NVIDIA は、エンドツーエンドの分析ワークフロー全体を高速化するソリューションを提供しています。組織は ETL パイプラインの処理時間を減らしたり、大規模な機械学習ワークフローを加速したりできます。NVIDIA が提供するソリューションでは、ハイパフォーマンス データ分析に最適化されたハードウェアとソフトウェアを組み合わせており、企業はそのデータを簡単に最大限活用できます。RAPIDS と NVIDIA CUDA を利用することで、データ実務者は NVIDIA GPU で分析パイプラインを高速化できます。データの読み込み、処理、トレーニングなどの分析オペレーションにかかる時間が数日から数分に短縮されます。CUDA のパワーを、おなじみの Python や Java をベースとする言語で活用できます。高速分析を簡単に始められます。

機械学習からディープラーニングまで、すべてを GPU で

Machine Learning to Deep Learning, All on GPU

データ準備 + ETL

RAPIDS + Spark 3.0 または Dask を使用し、NVIDIA GPU でテラバイト スケールの ETL パイプラインを迅速に実行し、高品質のデータセットを実務者に提供します。

トレーニング

RAPIDS cuML と Dask でオペレーションをサポートしてビジネスを支援するモデルを開発、反復、改良します。

ビジュアライゼーション

RAPIDS + Plotly Dash による大規模なビジュアライゼーションでデータを今まで以上に深く理解できます。

推論

ビジネス上の分析情報を短時間で生成し、RAPIDS FIL によるオペレーションと意思決定を支援します。

デスクトップからデータ センターまで、分析ソリューションを高速化

PC

機械学習を開始しましょう。

ワークステーション

データ サイエンス向けの新しいワークステーション。

データセンター

大規模運用される AI システム。

クラウド

用途の広い高速機械学習。

AI の力でビッグ データから価値を引き出す

NVIDIA の新しい ebook、「Accelerating Apache Spark 3.x—Leveraging NVIDIA GPUs to Power the Next Era of Analytics and AI」(Apache Spark 3.x の高速化 – NVIDIA GPU を活用して新時代の分析と AI にパワーを与える) をダウンロードして、Apache Spark の次なる進化の詳細をご覧ください。