NVIDIA Pascal
アーキテクチャ

無数の機会に無限の計算を

革命的な NVIDIA Pascal™ アーキテクチャは、尽きることのない計算の欲求に満たされたこの世界を認識し、理解し、シミュレートするコンピュータエンジンとして開発されました。半導体からソフトウェアまで、Pascal の随所に革新的な技術が使用されています。

NVIDIA Grid Virtual GPU Solution Overview
International Data Corperation IDC Whitepaper

PASCAL の 5 つの技術的ブレイクスルー

NVIDIA Pascal アーキテクチャは、5 つの技術的ブレークスルーに基づいて構築されており、デスクサイドからデータ センターまで従来の考え方を一変する新しいコンピューティング プラットフォームを実現します。

無類のエネルギー効率を実現する 16 nm FINFET

最先端の 16 nm FinFET ファブリケーション テクノロジで構築された 1500 億のトランジスタを持つ Pascal GPU は、これまでに製造された世界最大の FinFET チップです。 限りないコンピューティング ニーズのあるワークロードのために最速のパフォーマンスと最高のエネルギー効率を提供するように設計されています。

無類のエネルギー効率を実現する 16 nm FINFET

最先端の 16 nm FinFET ファブリケーション テクノロジで構築された 1500 億のトランジスタを持つ Pascal GPU は、これまでに製造された世界最大の FinFET チップです。 限りないコンピューティング ニーズのあるワークロードのために最速のパフォーマンスと最高のエネルギー効率を提供するように設計されています。

パフォーマンスの指数関数的な飛躍

Pascal は、GPU のコンピューティング アーキテクチャ史上、屈指のパワーを誇ります。HPC ワークロードで 5 TFLOPS を超える倍精度のパフォーマンスを含む、これまでにないパフォーマンスを提供するスーパーコンピューターにコンピューターを変えます。ディープラーニングの場合、Pascal 搭載システムはニューラル ネットワーク トレーニングにおいて 12 倍以上の飛躍をもたらし、トレーニング時間を数週間から数時間に短縮します - そしてディープラーニング推論のスループットを現世代の GPU アーキテクチャと比較して 7 倍向上します。

パフォーマンスの指数関数的な飛躍

Pascal は、GPU のコンピューティング アーキテクチャ史上、屈指のパワーを誇ります。HPC ワークロードで 5 TFLOPS を超える倍精度のパフォーマンスを含む、これまでにないパフォーマンスを提供するスーパーコンピューターにコンピューターを変えます。ディープラーニングの場合、Pascal 搭載システムはニューラル ネットワーク トレーニングにおいて 12 倍以上の飛躍をもたらし、トレーニング時間を数週間から数時間に短縮します - そしてディープラーニング推論のスループットを現世代の GPU アーキテクチャと比較して 7 倍向上します。

Data Center GPU Architecture Pascal Nvlink

大規模アプリケーションのスケーラビリティのための NVIDIA NVLINK

Pascal は革命的な NVIDIA NVLink™ 高速相互接続を初めて統合したアーキテクチャです。このテクノロジは複数の GPU にまたがるアプリケーションを拡張するように設計されており、相互接続の帯域幅において、現存するクラス最高のソリューションに比べ 5 倍高速化します。

Data Center GPU Architecture Pascal Memory

ビッグ データ処理に適した CoWoS と HBM2

Pascal アーキテクチャは、プロセッサとデータを 1 つのパッケージに統合し、これまでにない計算効率を提供します。革新的なメモリ設計手法を取り入れた CoWoS® (Chip-on-Wafer-on-Substrate) と HBM2 を使用することで、NVIDIA Maxwell™ アーキテクチャの 3 倍のメモリ帯域性能を実現できます。

新しい人工知能 (AI) アルゴリズム

新しい半精度 16 ビット浮動小数点命令は、これまでにないトレーニングパフォーマンスを実現するために 21 TFLOPS 以上を提供します。 47 TOPS (tera-operations per second) のパフォーマンスを備えた Pascal の新しい 8 ビット整数命令により、AI アルゴリズムがディープラーニング推論にリアルタイムの応答性を提供します。

新しい人工知能 (AI) アルゴリズム

新しい半精度 16 ビット浮動小数点命令は、これまでにないトレーニングパフォーマンスを実現するために 21 TFLOPS 以上を提供します。 47 TOPS (tera-operations per second) のパフォーマンスを備えた Pascal の新しい 8 ビット整数命令により、AI アルゴリズムがディープラーニング推論にリアルタイムの応答性を提供します。

前世代のアーキテクチャ

NVIDIA MAXWELL

2014 年に NVIDIA は、きわめて効率が高く、エネルギー効率を劇的に向上させる革新的な設計を可能にする NVIDIA Maxwell アーキテクチャを発表しました。このアーキテクチャは、大規模な専用共有メモリ、共有メモリ アトミック、SM ごとのよりアクティブなスレッド ブロックを特徴として、以前のアーキテクチャをはるかに上回るアプリケーションパフォーマンスを実現します。

NVIDIA KEPLER

NVIDIA Kepler™ アーキテクチャは、世界最大のスーパーコンピューターから大学のコンピューティング システムまで、世界中で数万のデータ センターを動かしています。Kepler アーキテクチャをベースとした最新のアクセラレータ、NVIDIA Tesla® K80 は、データ センターのコストを劇的に下げながら、高性能コンピューティングを必要とするお客様に圧倒的なパフォーマンスを提供します。

Data Center GPU Architecture Kepler Whitepaper
Data Center GPU Architecture Cuda Whitepaper

無料のテスト ドライブを試す

HPC とディープラーニングに最適な世界最速の GPU アクセラレータ

ご購入について

NVIDIA パートナーネットワーク (NPN) で、最適なパートナーを見つけてください。