GPU&メニーコアサービスの事例

nAGがスクエア・キロメートル・アレイ電波望遠鏡のためのグリッディングアルゴリズムを改良

[2018年4月掲載]

nAGはオックスフォード大学と協力して、畳み込みグリッディングアルゴリズムの性能を改善する方法を検討した結果、NVIDIA® P100上でより高速に実行されるこが示されました

 2017年11月10日:アルゴリズム、ソフトウェア、HPCの専門家であるnAG(Numerical Algorithms Group)は、オックスフォード大学e-Research CenterのScientific Computing Groupから、 Intel® Knights Landing(Xeon Phi™)とNVIDIA® P100 GPUをターゲットに、フリンジ・ビジビリティを処理するための電波天文学で使用される畳み込みグリッディングアルゴリズムの調査依頼を受けました。調査の間にnAGの専門家は、模擬的なスクエア・キロメーター・アレイ(SKA)データを使用し、アルゴリズム改良における特定のハードウェア選択による潜在的な違いを調査しました。

 スクエア・キロメーター・アレイ(SKA)電波望遠鏡は、2020年までデータ収集を開始する予定はありませんが、プロジェクトが生み出す膨大な量のデータを処理するために、必要となるソフトウェアを設計し実装する作業が既に進行中です。そこで、nAGはアルゴリズムについて検証することになりました。

nAGはSKAプロジェクトのための大規模データセットの信号処理コード最適化に関する初期的な性能比較を行い、このテーマに関する技術的なポスターをデンバーでのSupercomputing Trade Show and Conference (SC17)にて公開しました。


研究成果の概要

nAGは、調査した畳み込みグリッディングアルゴリズムがIntel® Knights LandingとNVIDIA® P100 GPUに完全には適していないことを見つけました。これは、データの可視性の空間的分布がランダムなメモリアクセスパターンとキャッシュされたデータ再利用をもたらし、グリッドの並列更新の際に競合条件が存在するためです。さらに、畳み込みステップでの複雑なメモリアクセスパターンが、効率的なベクトル化を阻害しています。

 このアルゴリズムのチューニングのために、nAGメンバーは、計算ドメインをタイルに分解してデータの再利用を促進し、コンボリューションデータへの連続したアクセスを可能にする手法を実装しました。最初の性能検証結果は、このタイリングがIntel® Knights Landingのパフォーマンスを大きく改善することを示しています。これはグリッドを更新するときに低速なアトミック処理を用いないためです。このコードは、NVIDIA® P100上でより高速に動作することが示されました。部分的にはGPUのアトミック処理性能に起因するものですが、頻繁にアクセスされるデータを格納するために多数のレジスタが利用できるためでもあります。



KNLとGPUで動作する電波天文学アプリケーション向けの並列畳み込みグリッディング
https://www.nag.com/market/parallel-convolution-gridding-radio-astronomy.pdf

SKAプロジェクトについては以下をご覧ください:
https://skatelescope.org/
https://en.wikipedia.org/wiki/Square_Kilometre_Array

オックスフォード大学e-Research Centerについては以下をご覧ください:
http://www.oerc.ox.ac.uk/


さらに詳細をお知りになりたい方はコンサルティングサービスのお問い合わせにご記入の上お問い合わせください。

関連情報
MENU
© 日本ニューメリカルアルゴリズムズグループ株式会社 2025
Privacy Policy  /  Trademarks