NVIDIA-Accelerated Data Science

The only hardware-to-software stack optimized for data science.

솔루션
특징 및 장점
GPU 가속 비즈니스 진행
RAPIDS
파트너

솔루션
특징 및 장점
GPU 가속 비즈니스 진행
RAPIDS
파트너

데이터 사이언스 워크플로우 GPU 가속

기존의 데이터 사이언스 워크플로우는 느리고 까다로웠으며, 데이터를 로드, 필터링, 조작하고, 모델을 학습하고 배포하는 데 CPU에 의존해 왔습니다. GPU는 NVIDIA RAPIDS™ 라이브러리를 사용하여 인프라 비용을 대폭 절감하고 엔드 투 엔드 데이터 사이언스 워크플로우에 탁월한 성능을 제공합니다. GPU 가속화된 데이터 사이언스는 데스크톱, 데이터 센터 내부, 엣지 및 클라우드를 포함한 어디서든 사용할 수 있습니다.

특징 및 장점

생산성 극대화

최고 가치의 인사이트를 얻고 ROI를 가속화하기 위해 대기 시간을 단축합니다.

더 많은 결과물

머신 러닝 트레이닝을 최대 215배 더 빠르게 가속합니다. 그리고 반복을 더 많이 수행하고, 실험을 늘리며, 더 심층적으로 탐구합니다.

가성비

데이터 사이언스 인프라 비용을 절감하고 데이터센터 효율성을 높이십시오.

RAPIDS로 GPU 가속화된 Apache Spark 3.0

Apache Spark 3.0은 분석 및 AI 워크로드에 완전히 통합되고 원활한 GPU 가속화를 제공하는 Spark의 첫 번째 릴리스입니다. 코드를 변경하지 않고 온 프레미스 또는 클라우드에서 GPU와 함께하는 Spark 3.0의 성능을 활용해보십시오. GPU의 획기적인 성능은 엔터프라이즈와 연구진에게 더 큰 모델을 더욱 자주 트레이닝하는 역량을 제공하여 궁극적으로 AI 성능을 활용한 빅 데이터의 가치를 확대합니다.

자세히 알아보기

150X

Faster Pandas with cuDF

* Benchmark on Groupy advanced operation (5GB) DuckDB Data Benchmark
HW: Intel Xeon Platinum 8480CL CPU and NVIDIA Grace Hopper™ GPU
SW: pandas v1.5 and cudf.pandas v23.10

5X

Faster Spark with the RAPIDS Accelerator for Spark

* NDS 2.0 benchmarks were run with parquet decimal data @ SF3K with UCX off

CPU-only: 8x n1-standard-32

GPU: 8x g2-standard-16, 8x L4 24GB
SW: Spark RAPIDS 24.02

48X

Faster NetworkX with cuGraph

* Benchmark on PageRank with synthetic dataset having ~16,384 vertices and ~524,288 edges
HW: Intel Xeon Platinum 8480CL CPU and NVIDIA H100 80GB (1x GPU)
SW: NetworkX v3.2 and cuGraph v23.10

NVIDIA GPU에 대한 XGBOOST 훈련

GPU 가속 XGBoost는 단일 노드 및 분산 배치 모두에서 세계 최고의 머신러닝 알고리즘에 획기적인 성능을 제공합니다. CPU에 비해 훨씬 빠른 훈련 속도를 통해 데이터 사이언스 팀은 더 큰 데이터 세트를 처리하고, 반복 시간을 단축하며, 모델을 튜닝하여 예측 정확성과 비즈니스 가치를 극대화할 수 있습니다.

Data Prep

XGBoost

End-to-end

CPU: Core i9 | End-to-end time = Data Prep + Conversion + Training + Validation

GPU 가속 XGBoost로 지금 시작하는 방법 알아보기

시작하기

데이터 사이언스를 위한 NVIDIA GPU 솔루션

다양한 NVIDIA GPU 솔루션의 뛰어난 가속 기능을 알아보십시오.

PC

머신 러닝을 시작하십시오.

워크스테이션

데이터 사이언스를 위한 새로운 세대의 워크스테이션

데이터센터

엔터프라이즈 제작을 위한 AI 시스템

클라우드

다재 다능한 가속 머신 러닝

GPU 가속 비즈니스 진행

머신 러닝 워크플로우의 성능, 생산성 및 ROI를 극대화하십시오.

RAPIDS: 데이터 사이언스 라이브러리 제품군

NVIDIA CUDA-X AI를 토대로 구축된 RAPIDS는 15년의 NVIDIA® CUDA® 개발 및 머신 러닝 전문 지식을 바탕으로 개발되었습니다. 이는 강력한 소프트웨어로, 엔드 투 엔드 데이터 사이언스 트레이닝 파이프라인을 GPU에서 완전히 처리하므로 며칠 걸릴 트레이닝 시간이 몇 분으로 줄어듭니다.

소스 코드 다운로드

NGC 컨테이너 다운로드

RAPIDS, a GPU-accelerated data science platform, is a next-generation computational ecosystem powered by Apache Arrow. The NVIDIA collaboration with Ursa Labs will accelerate the pace of innovation in the core Arrow libraries and help bring about major performance boosts in analytics and feature engineering workloads.

- Wes McKinney, Head of Ursa Labs and Creator of Apache Arrow and Pandas

I got 24x speedup using RAPIDS XGBOOST and can now replace hundreds of CPU nodes, running my biggest ML workload on a single node with 8 GPUs. You made XGBOOST too fast!?

- Streaming Media Company

My previous bottleneck was I/O. …10 minutes to pull in data for 10 stores (about 1 million rows). With RAPIDS, we can pull in data for about 6000 stores (millions of rows) in less than 3 minutes. That scale could have easily taken us 4 days on legacy infrastructure … just plain awesome.

- A mid-market specialty retailer with 6000 stores