関連情報

HPCチューニングサービスの事例

HECToRプロジェクト
CASTEPの速度改善

対象プログラム 電子構造計算
アプリケーション名 CASTEP
チューニング方法 バンド並列化
成果 速度が4倍化しスケーラビリティが改善
推定削減コスト(円換算):3億2千万円

HECToR dCSE チームは著名な物性科学コード(CASTEP)を4倍高速化しスケーラビリティを改善

英国の国立学術スーパーコンピューティング設備であるHECToR 向けのNAGの計算科学技術(CSE)サポートサービスのもとで業務を行うヨーク大学のHPC開発者は、物性科学コードCASTEPを最適化し、コード性能とスケーラビリティを劇的に改善しました。これは数百万ポンドの節約を可能にし、英国カー・パリネロコンソーシアム(UK Car-Parrinello Consortium (UKCP))において重要な新しい科学への挑戦を可能にしました。

このプロジェクトの責任者かつCASTEPユーザであるKeith Refson博士(STFC)は次のようにコメントしました:"バンド並列化されたCASTEPにより得られたパフォーマンスとスケーリング性の向上は、 HECToRのCPUの利用効率性の実質的な向上を示します。これは、より少ない処理時間やコスト、計画しているジョブのターンアラウンド時間の短縮をもたらすだけでなく、多くのプロセッサを使用して以前は実行出来なかった大規模で複雑なシミュレーションを実行可能にするでしょう。"

UKCP の会長, ヨーク大学の物理学部のMatt Probert博士は、CASTEPの改善がもたらした速度とスケーリングの進歩により、ソフトウェアは大規模な科学研究で、たとえば現行の予算内で少ない実時間で大規模な原子システム及び/あるいはより多くのシミュレーションで使用可能であると予測しました。実際に、いくつかの研究プロジェクトは2009年の改善版CASTEPのリリースを見越して待ち続けていました。

HECToR
HECToR はResearch Councils を代行する EPSRC により管理されており、英国学術界の科学と工学をサポートする任務を負っています。エジンバラ大学にある Cray XT スーパーコンピュータはUoE HPCx 社によって管理されています。 CSE サポートサービスはNAG 社によって提供されており、高度なスーパーコンピュータの効率的な活用のために、ユーザは確実に適切なHPC専門家にコンタクトできます。CSEサポートサービスの重要な特徴は分散型CSE(dCSE)プログラムです。これは簡潔なピアレビューを経てユーザからの提案に応える、特定のコードのパフォーマンスとスケーラビリティに対処するプロジェクトです。dCSE プログラムは、伝統的なHPCユーザアプリケーションサポートとNAG によるトレーニングで補われる、約 50 の集中的プロジェクトから成り立っています。

これまでに完了した dCSE プロジェクトは、CSEの尽力により可能なコスト削減と新しい科学の優れた適用例をもたらしました。ここで報告されているCASTEPプロジェクトは成功を収めたパフォーマンス改善であり、新たなサクセスストーリーとなっています。

プロジェクトの背景

dCSEプロジェクトの目的は、CASTEP(第一原理から固体の電子状態を計算するための平面波基底による密度汎関数理論を使用したソフトウェアパッケージ)を改善し、高いスケール性を持たせるように開発することでした。プロジェクトの主なタスクは、このコードがHECToR上で1,000コア以上を有効に利用可能にするために、バンド並列を実装することでした。CASTEP は原子レベルで様々な材料や分子をモデリングする目的で、HECToR上で利用されています。特に、分子動力学シミュレーション、最適化座標、バンド構造、光スペクトル、フォノンスペクトルの計算により、原子系の全エネルギー、原子間力及び圧力についての情報を得るためにCASTEPは実行されます。ラザフォード・アップルトン研究所(Rutherford Appleton Laboratory) の計算物性科学グループ(Computational Materials Science Group) のKeith Refson 博士がプロジェクトの主任研究員でした。また、デアズベリー研究所(Daresbury Laboratory)のMartin Plummer博士とヨーク大学のMatt Probert博士は共同調査員でした。 NAGは、CASTEPチームとNAG CSEチームと共同でコード開発作業を行うためヨーク大学・物理学部のPhil Hasnip 博士と契約しました。

CASTEPについて

CASTEPは第一原理から固体の電子特性を計算するための平面波基底の密度汎関数理論を使用したソフトウェアパッケージです。CASTEPは十分な機能を有する第一原理のコードで、それ自体非常に多くの機能があります。第一原理からシステムの物理特性を計算するには、基本量は全エネルギーであり、そこから様々な物理量を計算します。
http://www.castep.org/

プロジェクトの成果

この作業は優れた結果を示しました。改善されたコードは元のコードの2倍から4倍加速され、以前の256に対し現在は1000コア以上にスケールしています。

Matt Probert博士は、CASTEPコンソーシアムはHECToR上で1年につき約10M Allocation Units (AU)(注)−約£640kの想定コスト−を使用すると見積もりました。コードの効率性を2-4倍に高めることにより、1年に£320k−£480k (HECToRの残存期間で約£1.6m−£2.4mの節約)を節約できます。全部で約8人月の労力です。
大量の投資利益に言及して、Probert 博士は述べました。『私はそれが重要なソフトウェアパッケージのサポートの価値を証明していると思います。そして使用規模によってかなりの節約があると思います。また、 HECToR dCSE スキーマはサポートや継続する価値が十分にあります。dCSE 博士研究員(この場合Phil Hasnip ) は金額相応の価値があります!』


(注)アロケーションユニット(allocation unit, AU)はHECToRにおけるノード課金単位です。大まかに言えばLinpackベンチマーク(Rmax)を基にした1時間当たり1Tflopsの実行量がkAUに相当します。例えば60Tflopsのプロセッサ群は60kAU/時間に相当します。

詳細なテクニカルレポートは以下で参照いただけます。
http://www.hector.ac.uk/cse/distributedcse/reports/

さらに詳しくお知りになりたい場合は、日本NAG株式会社 コンサルティンググループご相談窓口 http://www.nag-j.co.jp/nagconsul/toiawase.htm (あるいはメール:consul@nag-j.co.jp)までお問い合わせください。



Results matter. Trust NAG.

Privacy Policy | Trademarks