面向计算流体力学应用开发框架容错周期优化方法.docVIP

面向计算流体力学应用开发框架容错周期优化方法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向计算流体力学应用开发框架容错周期优化方法

面向计算流体力学应用开发框架容错周期优化方法   摘 要: 针对计算流体力学应用开发框架容错支持能力的不足,提出了一种新的容错周期优化方法。该方法基于系统故障的概率建模,计算得到理想最优容错周期;并结合计算流体力学应用场数据输出的特点,在线确定实际检查点备份时机。三个典型应用的实验结果表明,在不同平均无故障时间的系统上,与固定时间步进行容错的方法相比,该方法总能够得到最优的容错开销。用户可以基于该方法通过框架接口便捷地设置容错周期,并有效降低容错所引起的开销。 关键词:容错;周期优化;检查点;计算流体力学;开发框架 中图分类号: TP302.8 文献标志码:A Fault-tolerance period optimization method for computational fluid dynamics-oriented application development frameworks Abstract: For the fault-tolerance shortage of CFD (Computational Fluid Dynamics)-oriented application development framework, a new fault-tolerance period optimization method was proposed. The method computed the ideal best fault-tolerance period based on the probability model of systems faults, and online determined the occasion of real check points with the consideration of CFD fields output characteristic. The experimental results of three applications show that on the systems with different mean time between faults, compared with the fault-tolerance method based on performing fault-tolerance between fixed steps, the proposed method can always get the best fault-tolerance overheads. Based on this method, user can set the fault-tolerance period with framework interfaces conveniently and reduce the fault-tolerance overheads. Key words: fault-tolerance;period optimization;check point;Computational Fluid Dynamics (CFD);development framework 0 引言 计算流体力学(Computational Fluid Dynamics, CFD)是一门流体力学和数值方法相结合的交叉学科。由于具有成本低、能模拟较复杂或较理想过程等优点,利用并行计算机对CFD应用进行模拟计算已经成为与传统的理论分析和实验验证一样重要的流体力学研究方法[1]。近年来,随着高性能计算技术的突飞猛进,CFD方法得到飞速发展,在诸多工程技术领域都有广泛应用,其取得的丰硕成果已经受到了学术界和工业界的充分认可。 然而,高性能计算在不断提升CFD方法模拟性能的同时,也带来了两个问题:一方面,高效CFD问题涉及多个学科知识,高效的并行应用开发需要物理/化学/生物领域专家、数值计算专家和并行计算专家的相互合作;另一方面,由于芯片集成度的提高和系统并行度的增加,高性能计算机的可靠性问题日益突出,有研究结果表明当系统的并行度达到数十万核时,系统的平均无故障时间(Mean Time Between Faults, MTBF)仅为小时量级[2],而最新国际Top500排行榜前十名的机器均拥有数十万乃至数百万个处理器核[3]。 为了应对高效CFD并行程序开发困难的问题,研究人员设计了面向CFD应用领域的并行应用开发框架(后文简称为面向CFD应用开发框架),如商用框架软件Fluent[4]和开源框架软件OpenFOAM[5]。这类框架对应用采取了高层抽象,屏蔽了底层程序设计细节,用

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档