このワークショップでは、OpenACC を利用して超並列 GPU で C/C++ または Fortran のアプリケーションを実行し、高速化するためのツールとテクニックを取り上げます。コードの書き方、OpenACC でコード並列化を構成する方法、CPU と GPU アクセラレータ間のメモリ移動を最適化する方法、学習したワークフローを新しいタスクで導入する方法 (機能は揃っているが CPU のみのケースを高速化)、パフォーマンスが大幅に向上する Laplace Heat Equation コードについて学びます。ワークショップの修了後は、GPU で高速化する新しいアプリケーションを自分で開発するための追加リソースをご利用いただけます。
学習目標
このワークショップに参加すると、OpenACC を利用し、C/C++ または Fortran のアプリケーションを GPU で高速化するための基礎的なツールとテクニックを理解し、次のことができるようになります。
- CPU のみのアプリケーションをプロファイルして最適化し、高速化のホット スポットを特定する。
- OpenACC ディレクティブを使用し、コードベースを GPU で加速する。
- CPU と GPU アクセラレータ間のデータ移動を最適化する。
ワークショップ データシートをダウンロードする (PDF 318 KB)