VLPL-S在KnightsLanding上的优化与性能-上海超级计算中心.PDF

VLPL-S在KnightsLanding上的优化与性能-上海超级计算中心.PDF

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
48 《高性能计算发展与应用》 2018年第一期 总第六十二期 VLPL-S在Knights Landing上的优化与性能评估 1,2 1 2 3 1,4  丁丹迪 文敏华 周姗陈民 林新华 1上海交通大学高性能计算中心 上海 200240 2英特尔亚太研发中心 上海 200240 3上海交通大学物理与天文系 上海 200240 4东京工业大学 日本 摘要: 光等离子模拟领域的常用主流算法之一。在本篇文章中,我们将讲述VLPL-S 代码在Intel®新推 出的Knights Landing平台上的早期移植及优化工作。通过应用在代码优化中常用的优化方法,例 如访存优化、多线程优化、向量化,我们为VLPL-S代码实现了1.68倍的加速比。对于优化以后 性能提升。结果表明,对于VLPL-S代码而言,以往CPU代码优化工作中常用的优化方法在新的 Knights Landing 平台中同样有效。 关键词:激光等离子体模拟,Particle-in-cell,Knights Landing 1.引言 访存延迟,预取优化方法显著提升了程序在Knights 随着高性能计算领域的快速发展,激光等离 Landing(KNL)上的性能。通过应用了多线程优化, 子体模拟程序可以在更大维度以及更高的精度下进 VLPL-S在KNL集群上的性能也得以提升。使用这些 [1] 优化方法后,VLPL-S相比于原版程序获得了1.68倍 行。 “虚拟激光等离子体实验室”程序 (VLPL)是一 份基于C++开发的三维激光等离子体模拟程序,它被 的加速比。 [2][3][4] 这篇文章的组织结构如下:第二部分介绍相关 广泛应用于激光与等离子体相互作用的研究中 。 VLPL-S由上海交通大学陈民特别研究员在VLPL基础 工作。第三部分和第四部分简要介绍PIC算法和Intel 上进一步开发,加入优化了碰撞电离、场致电离以 KNL架构。详细的优化方法将在第五部分讲述,然后 及两体碰撞效应和粒子跟踪,并提供了对众核平台 在第六部分对优化后的性能进行评估。最后,第七 的支持。在代码中,电子的离化是使用虚函数开发 部分给出结论以及后续优化思路。 实现的,体现了面向对象编程语言的特性;移动窗 口方法也应用到了程序中以研究加速能量达GeV的长 2.相关工作 距离激光尾波场加速问题;通过加入以上的模拟方 在最近高性能计算快速发展的三十年内,许多 法,程序可以对Terahertz辐射、中性气体与激光相互 学者提出了各自PIC算法的实现。这些实现从侧面说 [6] 作用中的光脉冲及离化波前演化、激光尾波场加速 明了PIC算法的并行可能性。Bastrakov等学者 最近 [5] 讲述了对其实现的PIC代码在多核平台、KNC(Intel第 及表面电子加速等物理过程进行研究 。 在本篇文章中,V

您可能关注的文档

文档评论(0)

zhaoxiaoj + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档