このワークショップでは、超並列 GPU と CUDA® で実行する C/C++ アプリケーションを高速化するための基礎的なツールと手法について学習します。コードの記述方法、CUDA によるコード並列化の構成方法、CPU と GPU のアクセラレーター間のメモリ移行最適化方法、新しいタスク (完全に機能するが CPU のみの微粒子シミュレーターを高速化し、大幅なパフォーマンス アップが観察できる) で理解されたワークフローの実装方法について学習します。ワークショップの終了時には、GPU 対応のアプリケーションを自分で新しく作成するための追加リソースを利用できます。
学習目標
ワークショップの最後には、CUDA を使用した GPU アクセラレーテッド C/C++ アプリケーションの
- GPU アクセラレーターで実行するコードを記述する
- CUDA を使用し、C/C++ アプリケーションでデータと命令レベルの並列性を公開し、表現する
- CUDA で管理されるメモリを活用し、非同期の事前フェッチを利用してメモリ移行を最適化する
- コマンドラインとビジュアル プロファイラーを活用して作業を誘導する
- 命令レベルの並列性のために同時ストリームを活用する
- GPU で高速化する CUDA C/C++ アプリケーションを記述するか、プロファイル駆動型手法で既存の CPU 専用アプリケーションをリファクタリングする
ワークショップ データシートをダウンロードする (PDF 294 KB)