世界最速の単精度小数点演算アクセラレーターとして、 防衛、地震、生命科学、ビデオの分野で人気のアプリケーションを高速化
2012年6月18日 - ISC'12(ドイツ、ハンブルク) -NVIDIA(本社:米国カリフォルニア州サンタクララ、社長兼CEO: ジェンスン・フアン(Jen-Hsun Huang)、Nasdaq:NVDA)は本日、新たなベンチマーク結果を公表し、NVIDIA® Tesla® K10 GPUが地震データ処理から生命科学、動画処理にいたるまで、人気のハイパフォーマンスコンピューティング(HPC)アプリケーション各種においてパフォーマンスのブレークスルーを実現していると発表しました。
新しいNVIDIA Kepler™コンピューティング・アーキテクチャを採用したTesla K10 GPUは、アクセラレーターひとつで単精度小数点演算について業界最高のパフォーマンス(4.58テラフロップス)と最高のメモリー帯域幅(320GB/秒)を実現することができます。最新のIntel Sandy Bridge CPUに比べると、単精度小数点演算は12倍、メモリー帯域幅は6.4倍にもなっているのです。 (1)
Tesla K10 GPUは、4つの主要市場セグメントで使われる、多くの計算処理を要求する人気のアプリケーションにおいて、CPUや旧世代GPUのいずれをも凌駕する性能を発揮します。
- 防衛:動画解析、動画のぶれ補正、オルソ補正、コンピュータービジョンなど
- 生命科学と材料科学:分子動力学
- 石油・ガス:地震データ処理、リバースタイムマイグレーション
- メディアおよびエンターテイメント:動画編集、動画のレンダリング/トランスコーディング、レイトレーシング
NVIDIAのTeslaビジネス担当シニア・ディレクター、スミット・グプタ(Sumit Gupta)は次のように述べています。「Tesla K10 GPUの大きな特長は、総合的なアプリケーション・パフォーマンスに劇的な違いをもたらす浮動小数点演算とメモリー帯域幅ですばらしい性能を発揮する点です。このふたつがポイントとなり、K10 GPUを搭載すれば、それだけで最先端の科学アプリケーションや工学アプリケーション、商用アプリケーションのパフォーマンスが大幅に高まります。開発者側でしなければならないことはあったとしてもごくわずかです。」
AMBERとLAMMPSでパフォーマンス記録を更新
人気の生体分子シミュレーション・ソフトウェア、AMBERについて、世界記録を塗り替えるパフォーマンスを4個のTesla K10 GPUがたたき出しました。数年前であれば複数のラックにサーバを満載しなければ得られなかったほどのすばらしい結果が出たのです。 (2)
このTeslaシステムでは、23,558原子からなる分子について、76ナノ秒分のコンピューター・シミュレーションを1日で行うことができました。これは、昨年、4個のTesla M2090が出した記録を上回る結果です。今後は、何千人もの研究者が個人的にスーパーコンピューティング・パフォーマンスを手に入れ、新薬発見や有効性の高い新材料の開発など、さまざまなイノベーションが生まれることになると思われます。
サンディエゴ・スーパーコンピュータ・センターのロス・ウォーカー(Ross Walker)助教授は、次のように述べています。「生体分子科学の世界では、シミュレーション時間がほんの数ナノ秒増えると、複雑な生物学的系の挙動を研究し、理解する能力が格段に向上したりします。1個のTesla K10が最大級のCPUクラスタを超えるような性能を発揮するというのは、本当に驚きです。これは研究者にとって大きな朗報だと言えます。さまざまな疾病や傷害についていままでよりも優れた、新しい治療方法をすばやく探索できるようになるからです。」
生命科学に関する研究ではAMBERのほかにLAMMPSというアプリケーションも広く利用されていますが、Tesla K10 GPUは、LAMMPSにおいても最高のパフォーマンスを発揮します。LAMMPS Lennard Jones Liquidベンチマークを実行したところ、Tesla M2090 GPU 1個に対してTesla K10 GPU 1個は80%も高い性能を示しました。これは、x86 CPU、64個を搭載したクラスタに匹敵するパフォーマンスです。 (3)
エネルギー探査のスピードアップ
石油・ガスの探査業界における地震データ処理やコンピュータービジョン業界における画像処理にはリバースタイムマイグレーション(RTM)アプリケーションが利用されますが、NVIDIA Tesla GPUは、RTMアプリケーションについても最高のパフォーマンスを提供しつづけています。ブラジルの石油ガス公社、Petrobrasでは、RTMアプリケーションにTesla K10 GPUを採用し、Tesla M2090 GPUに対して1.8倍ものスピードアップを実現しました。消費電力は同等で変化していません。
NVIDIA Tesla K10 GPUは、今月より、Appro Supercomputer Solutions、Dell、HP、IBM、SGI、Supermicroなどの大手OEMメーカーおよびNVIDIAの流通チャンネル経由で購入することができます。Tesla K10についての詳しい情報は、NVIDIAのTeslaウェブサイトをご覧ください。
NVIDIA Tesla GPUについて
NVIDIA Tesla GPUはNVIDIA CUDA®並列コンピューティング・プラットフォーム採用の超並列アクセラレーターです。Tesla GPUはハイパフォーマンスコンピューティング、計算科学、スーパーコンピューティングに対応できるように基礎から設計したプロセッサーで、科学的アプリケーションや商用アプリケーションにおいてCPUのみのアプローチよりも劇的に高いパフォーマンスを提供することができます。
NVIDIA Tesla GPUについての詳細は、Teslaウェブサイトをご覧ください。CUDAについての詳細を知りたい場合、あるいは、その最新バージョンをダウンロードしたい場合は、CUDAウェブサイトをご覧ください。そのほか、NVIDIAニュース&イベントにおいて、NVIDIA関連のニュース、会社や製品に関する情報、動画/画像など、さまざまな情報を提供しています。ツイッターでも情報を提供しています(@NVIDIATesla)。
About NVIDIA
1999年、NVIDIAによるグラフィックス・プロセッシング・ユニット(GPU)の発明が、世界中の人々にコンピュータグラフィックスの可能性を認識させることとなりました。今日、NVIDIAのプロセッサはスマートフォンからスーパーコンピューターまでの幅広い製品に、またモバイル・プロセッサは携帯電話、タブレット、および車載インフォテインメント・システムに搭載されています。なかでもPCゲーム分野ではリアリティあふれる仮想空間の実現によって多くのゲーマーを魅了しています。専門的な分野では、映画製作における高度な視覚効果や3Dグラフィックスをはじめ、ジャンボジェット機からゴルフクラブにいたるまであらゆるものの開発に役立っているほか、より高性能なコンピューターを必要とする先端科学の研究者にも利用されています。NVIDIAが保有する特許は申請中のものも含めると4,500件以上に上っており、近代的なコンピューティング技術の基礎となっているものも数多く含まれています。当社の詳細についてはwww.nvidia.co.jpまたは日本語サイトwww.nvidia.co.jpをご覧ください。
# # #
本参考情報に記載されている記述の中には、NVIDIA Tesla GPU に関する特許の影響など、これらに限らず、将来予測的なものが含まれており、予測とは大幅に異なる結果を生ずる可能性があるリスクと不確実性を伴っています。これらのリスクと不確実性に関してはこれらに限らず、世界的な経済環境、サードパー ティーに依存する製品の製造、組立、梱包、試験、技術開発および競合による影響、新しい製品やテクノロジーの開発あるいは既存の製品やテクノロジーの改 良、当社製品やパートナー企業の製品の市場への浸透、デザイン、製造、あるいはソフトウェアの欠陥、ユーザーの嗜好および需要の変化、業界標準やインターフェースの変更、システムを統合する際の当社製品および技術の予期せぬパフォーマンスの損失などがあり、その他のリスクの詳細に関しては、Form 10-Kの2012年1月29日を末日とする会計年度レポートなど、米証券取引委員会(SEC)に提出されているNVIDIAの報告書に適宜記載されます。 これらの将来予測的な記述は発表日時点での見解に基づくものであり、NDIVIAはこれらの記述を更新する一切の義務を負いません。
Copyright® 2012 NVIDIA Corporation. All rights reserved. NVIDIA、NVIDIAのロゴ、Kepler、 CUDAおよびTeslaは、米国およびその他の国におけるNVIDIA Corporationの商標または登録商標です。その他の会社名および製品名は、それぞれの所有企業の商標または登録商標である可能性があります。機 能、価格、可用性、および仕様は予告なしに変更されることがあります。
___________________________________________
(1) Intel Xeonプロセッサー(E5-2690)との比較です。
(2) サーバシステムは4ノードで、各ノードはTesla K10 GPUが1個、Intel Xeon X5670が2個、DDR3メモリーが72GBという構成でした。大型クラスタのパフォーマンスベンチマークについては、//ambermd.org/amber10_bench_files/jac_nve_kraken_ranger_large.pngをご覧ください。
(3) //lammps.sandia.gov/bench/lj_xt5.html