- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
有限元结构分析的层级负载均衡并行计算方法.PDF
2017 年 第 62 卷 第 13 期: 1430 ~ 1438 《中国科学》杂志社
论 文 SCIENCE CHINA PRESS
有限元结构分析的层级负载均衡并行计算方法
1,2 1,2* 3
苗新强 , 金先龙 , 丁峻宏
1. 上海交通大学机械系统与振动国家重点实验室, 上海 200240;
2. 上海交通大学机械与动力工程学院, 上海 200240;
3. 上海超级计算中心, 上海 201203
* 联系人, E-mail: jxlong@
2016-08-17 收稿, 2016-09-19 修回, 2016-09-20 接受, 2017-03-28 网络版发表
国家高技术研究发展计划(2012AA01A307) 、国家自然科学基金和国家重点研发计划(2016YFB0201800)资助
摘要 由于性价比高、计算能力强, 多核机群已经成为当今高性能计算的主流工具. 然而, 多核机群环境下不同
的存储机制和通信延迟特点也为高效并行算法的设计带来了挑战. 为充分利用多核机群的硬件资源获取最优性能,
本文设计了一种有限元结构分析的层级负载均衡并行计算方法. 该方法建立在对计算任务的层次性和粒度性充分挖
掘的基础上. 为与多核机群的硬件拓扑体系结构相适应, 本文将计算任务划分为三个层次: 节点间并行、片间并行和
核间并行. 其中, 节点间并行和片间并行采用粗粒度并行计算方法, 而核间并行采用细粒度并行计算方法. 通过将
计算任务映射到多核机群的不同硬件层面执行, 该方法不仅有效实现了不同层面的负载均衡, 而且大幅度降低了系
统的通信开销. 此外, 它还大幅度减少了子区域的数目, 有效提高了界面方程的数值收敛性. 为验证算法的有效性,
在“天河二号”超级计算机上进行了有限元结构线性静力分析大规模并行计算测试. 结果表明: 同传统区域分解法相
比, 层级负载均衡并行计算方法能够获得较高的加速比和并行效率. 本文的研究主要集中在线性静力学问题上. 对
于非线性问题或者动力学问题, 由于涉及多个迭代步, 因此可以将本文算法封装为一个子函数进行调用.
关键词 多核机群, 有限元分析, 并行计算, 负载均衡
直接法和迭代法是有限元结构分析并行计算的 利用直接法消去每个子区域的内部自由度, 再通过迭
两种基本方法. 直接法通过排序、三角分解和回代求 代法求解界面方程, 最后根据求得的边界位移回代各
解等能够给定线性系统的精确解, 并且具有良好的数 子区域内部自由度. 利用区域分解法进行有限元结构
[1~3] [4] 分析并行计算时, 各子区域仅在求解界面方程的过程
值稳健性 . 然而, 它往往需要较大的内存空间 .
迭代法是基于试验和误差的方法, 它通过多次迭代求 中需要相互通信, 而其他计算过程均可在各子区域内
解对结果进行改善以尝试收敛到问题的精确解[5,6]. 部独立完成. 因此, 在传统单核处理器构建的超级计
相对直接法来说, 迭代法具有所需内存空间小的优点. 算机上, 区域分解法能够获得较高的并行计算效率.
但迭代法不一定在合理的时间内收敛, 对条件数很大 随着处理器和超级计算机体系结构的发展, 多
文档评论(0)