- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1P15OpenFMOにおける中心クーロン相互作用項計算のGPGPU
1P15
OpenFMO における4 中心クーロン相互作用項計算のGPGPU 化の試み
1 2 1 1 1
○梅田宏明 、塙敏博 、庄司光男 、朴泰祐 、重田育照
1 筑波大学 計算科学研究センター ( 〒305-8577 つくば市天王台1-1-1)
2 東京大学 情報基盤センター ( 〒277-8589 柏市柏の葉5-1-5)
序
GPU 等の演算加速装置を用いた高性能科学技術計算システムへの対応は、量子化学計算においても
重要なトピックとなっている。これまでに我々はHartree-Fock(HF)計算のホットスポットであるFock
行列計算のGPGPU 化[1]を行ってきた。フラグメント分子軌道(FMO)計算[2]プログラムの大規模計算
機向け実装であるOpenFMO [3] にGPGPU 化Fock 行列計算コードを導入する[4]など、GPU を使った大
規模分子軌道計算に向けた開発を進めている。本発表ではOpenFMO によるFMO 計算でホットスポッ
トになる4 中心静電相互作用項(ESP)計算についてのGPGPU 化の取り組みについての現状を報告する。
実装
二つの近接フラグメント間の静電相互作用を計算する4 中心ESP 計算のアルゴリズム構成はFock 行
列計算と類似しており、Fock 行列計算のGPGPU 化で行なった手法の多くを活用できる。大きな違い
としては、計算された二電子積分を用いて行列に加算するのが一方のフラグメントに対するクーロン
項に限られていることが挙げられる。Fock 行列計算では行列全体に広がる可能性のある6 つの行列要
素の加算が必要であったため、当時のGPU が苦手としていた排他的な行列加算を多数回行う必要があ
り、これを回避するための特別なアルゴリズムが要求されていた。今回の4 中心ESP 計算ではこの行
列への加算部分がクーロン項の1 要素のみであるため、比較的容易に行列加算が可能である。
具体的な実装方針としては、フラグメントA のシェルペアについてのループをGPU のブロックに配
分し、フラグメントB についてのシェルペアループをブロック内のスレッドに配分する並列化を行っ
た。この際Fock 行列計算のGPGPU 化と同様に、シェルペアの並べ替えやSchwarz 不等式によるスク
リーニングプロセスの分離、さらにはブロック間での動的負荷分散などを適用した。
このような並列化のもとでは、同一ブロック内の全てのスレッドが同じ行列要素に加算していくこ
とになる。これはフラグメントB についてのシェルペアループ終了後に同一ブロック内スレッドで加
算要素のリダクション処理を行うことで置き換えられるが、このリダクション処理については共有メ
モリの利用やシャッフル演算などのアルゴリズムが知られており、それを活用することで高速なリダ
クションが可能となる。一方、異なるブロックでは必ず異なる行列要素に加算することも容易にわか
る。このため結果の行列はGPU 全体でただ一つだけ持てば良く、各ブロックのマスタスレッドがこの
行列に単純加算する形で実装できる。
性能評価
実装したGPGPU 化4 中心ESP 計算コードの性能評価は筑波大学のHA-PACS ベースクラスタ[5] 2
ノードを用いて行った。HA-PACS ベースクラスタの計算ノードには2 台の8 コアIntel E5 CPU(Sandy
Bridge-EP, 2.6GHz) と4 台のFermi 世代のGPGPU(NVIDIA M2090 GPU)、および128GB のメモリが搭載
されており、それらがInfiniBand QDR2 ポートにより接続されている。また複数GPU を活用するため
ノードごとに4MPI プロセスを起動し、それぞれのプロセスがOpenMP 並列で4 CPU コアと1 台のGPU
を利用することとした。コンパイルや実行にはIntel コンパイラ15.0.2, CUDA 6.5.14, IntelMPI5.0 をそれ
ぞれ利用した。OpenFMO は耐故障性ミドルウェアであるfalanx により実装されたものを利用した。
性能評価としてアラニンの10 量体(112 原子、5 フラグメント) のFMO-HF/6-31G(d)計算を取り上げ、
この計算の4 中心ESP 計算[(ss,ss) タイプ] についての
您可能关注的文档
- 電気推進ロケットエンジンの推進性能と内部プラズマ物理現象 に関る.pdf
- 湘南モノレール鉄道安全報告書2016.pdf
- 平成年度がん治療最前線-kawasaki.pdf
- 電子陽電子入射器棟ダンピングリングトンネル室内の管理 22 3.pdf
- 1.医科(別紙).pdf
- 氏名志田晃一.pdf
- 環境コミュニケーション.pdf
- ThedevelopmentstatusofKEK-cERLinMHI.pdf
- 【使用目的、効能又は効果】.pdf
- 様式C-19科学研究費補助金研究成果報告書.pdf
- 反意語謝罪の、すまなそうなとてもひどい充当.pdf
- 国際エネルギースタープログラムの対象製品基準(複合機).pdf
- 目医発第521号(保90)平成18年8月8目.pdf
- 一者応札応募等事案フォローアップ票.pdf
- 地学教育第61巻第3号(通巻第314号)2008年5月25日発行(年6回発行)昭和41年11月.pdf
- roadmapsummaryhec080921.pdf
- 「元素誕生のからくり」.pdf
- 桁間衝突用緩衝材の衝撃力低減効果に関する実験的検討(その1).pdf
- 委託業務成果報告書(平成21年度)「超伝導加速による次世代小型高輝度光子ビーム源の開発」 新フォトカソード開発及び.pdf
- ネットは厚木市新厚木市立病院.pdf
最近下载
- 统编版八年级下册历史期末专题训练:选择题(含答案).docx VIP
- 初二八年级下学期期末家长会PPT课件.ppt VIP
- 数据结构 期末考试试卷.doc VIP
- 学习强国深圳经济特区建立40周年题库及答案.docx VIP
- 云南师范大学2020-2021学年第1学期《数据结构》期末考试试卷(A卷)含标准答案.docx
- 从军行之四翻译及注释 从军行赏析王昌龄.pdf VIP
- 2025年广东省高考物理真题卷(含答案与解析).pdf VIP
- 四年级语文下册1-8单元达标检测卷(人教)附答案(好卷).docx
- 中国人寿财产保险股份有限公司道路危险货物承运人责任保险条款.pdf VIP
- 部编版小学语文1-6年级日积月累整合.doc VIP
文档评论(0)