PRIMEHPCFX10のMPI性能改善状況.pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PRIMEHPC FX10 のMPI 性能改善状況 富士通株式会社 TC)計算科学) 坂口吉生 はじめに 本稿では、東京大学情報基盤センターで2012 年4 月から稼働している富士通PRIMEHPC FX10 (以 降、FX10) 向けMPI(Message Passing Interface)ライブラリの性能改善状況について記載します。 FX10 システムの並列計算におけるノード間通信は、富士通独自開発の6 次元メッシュ/ トーラスイ ンターコネクト(Tofu インターコネクト*1)を採用しており、1 次元から3 次元のトーラス形状のネット ワーク構成でアプリケーションプログラムの性能が最大限に引き出せるようになっています。 しかし、1 ノード内複数プロセスのMPI 性能においては性能改善要望があり、2013 年に、チューニ ングを施した性能改善版MPI のシステム適用を実施しましたので、改善状況を報告します。 性能改善状況 東京大学情報基盤センター FX10 (Oakleaf-FX) の定期保守時に性能改善を行った MPI 関数を以下 に記載します。 CY2013 1Q 2Q 3Q 4Q TCS-LANG 1.2.1-04 TCS-LANG 1.2.1-07 TCS-LANG 1.2.1-08 1/25 保守▲ 9/20 保守▲ 12/20 保守▲ MPI_Bcast 改善 MPI_Alltoall 改善 MPI_Alltoallv 改善 MPI_Allreduce 改善 MPI_Allgather 改善 MPI_Allgatherv 改善 MPI は言語処理系ソフトウェア (Technical Computing Suite/Technical Computing Language、以降 TCS-LANG) に含まれており、版数管理が行われています。1.2.1-04 版では、Bcast、Allreduce の性能 を改善し、1.2.1-07 版では、Alltoall、Allgather の性能を改善し、最新版の1.2.1-08 版では、Alltoallv、 Allgatherv の性能改善を実施しています。 Oakleaf-FX の言語処理系ソフトウェアの版数は、常に最新版が使用されるように環境変数が設定さ れています。詳細は、利用支援ポータル(https://oakleaf-www.cc.u-tokyo.ac.jp) に格納されている 「Oakleaf-FX 利用手引書」の「1.11.3 実行パス/ライブラリ設定」を参照して下さい。 性能改善内容 Oakleaf-FX 稼働時から、いくつかのTofu インターコネクト向けにチューニングされたアルゴリズム (以降、従来のTofu 専用アルゴリズム)が存在していました。従来のTofu 専用アルゴリズムは、ノード 内に 1 プロセスが生成された場合の性能をターゲットとしていましたが、ノード内に複数のプロセス が生成された場合に改善される新アルゴリズムを作成し、性能を改善しています。 *1 Tofu (Torus fusion) は、富士通の高速インターコネクトの呼称です。 スーパーコンピューティングニュース - 27 - Vol.16,No.2 2014 新アルゴリズムは、Bcast, Allreduce, Alltoall, Allgather, Alltoallv, Allgatherv の6 関数に対して適用し ています。通信はノード間をRDMA 通信で実装し、ノード内はTofu ループバック通信または独自の共 有メモ

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档