GPU并行计算在粒子沉降晶格玻尔兹曼模拟中的应用与优化Application and optimization of GPU parallel computing in Boltzmann simulation of particle settling lattice.pdfVIP

GPU并行计算在粒子沉降晶格玻尔兹曼模拟中的应用与优化Application and optimization of GPU parallel computing in Boltzmann simulation of particle settling lattice.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
GPU并行计算在粒子沉降晶格玻尔兹曼模拟中的应用与优化Application and optimization of GPU parallel computing in Boltzmann simulation of particle settling lattice

GPU并行计算在粒子沉降晶格玻尔兹曼模拟中 的应用与优化 专业名称:计算机应用技术 申请人:党任亚 指导教师:张超英 论文答辩委员会 嫡躯。、势i薜:叁羔!垄堑 委员:瀣鲎 !熊拯 ≥ 摘要 GPU并行计算在粒子沉降晶格玻尔兹曼模拟中的应用与优化 研究生姓名:党任亚 导师姓名:张超英 学科专业: 计算机应用技术 研究方向:智能计算 年级:2011级 ||UlI l Ul I I IIIIII I l UI 摘要 粒子沉降运动在自然界中是一种很常见的现象,而且这一运动现象也广泛存在于众 多领域中,例如工业应用、生命科学、环境科学和医学科学等。因此,近年来对粒子沉 降这一现象的研究引起了许多学者的关注。由于粒子沉降涉及复杂的计算,人们无法采 用理论的方法将其求解,而实验的方法也受到了种种阻碍。随着数值计算方法的兴起, 给粒子沉降现象的模拟带来了希望,而目前在流体力学领域应用比较多的数值模拟方法 Boltzmann 就是晶格玻尔兹曼方法(Lattice Method,LBM)。 LBM是近年发展起来的一种新流体力学计算方法,它算法较为简单,又易于处理复 杂边界,并且还具有天然的并行性,非常适合大规模的并行计算。因此被广泛用来数值 模拟各种复杂流体力学问题。关于LBM,在本文的第二章有简要介绍。本文采用LBM方 法建立了单粒子的粒子沉降二维动力学模型,利用所建模型数值模拟单粒子在流体中的 二维沉降运动。 通过运用LBM,目前对粒子沉降现象的研究已经有了很大的进展,但大多数仅仅只 是实现对各种粒子沉降运动的模拟,却没有人考虑其模拟的效率问题。由于粒子沉降模 型之复杂,数据量之大,当模型规模比较大时,模拟所耗时间就会相当长从而导致效率 低下。在当今高速发展的社会,效率是一个很重要的因素。粒子沉降现象是可以被广泛 运用的,因此对该模型的模拟进行加速,提高其效率非常有必要。本文的研究重点就是 如何提高粒子沉降模拟效率。 虽然LBM有着天然的并行性,但也只是相对于传统的数值模拟方法有了一些改进, 为了使其模拟过程更加高效,本文采用了近年发展并迅速流行起来的方法——在CUDA 的并行性完美结合,达到最佳效果。关于GPU和CUDA,在第三章有简要的介绍。 算方法的可行性和高效性,然后再在CUDA框架下设计并实现了粒子沉降运动在GPU上 模拟计算,实验结果证明在GPU上进行基于LBM的粒子沉降运动数值模拟的并行计算是 摘要 完全可行的,其模拟结果与在CPU上进行模拟的结果完全一致,而且还可以获得非常可 观的加速性能。 虽然基于GPU的并行计算大大提高了程序运行效率,但我们并不满足于此,在此基 础上还可以通过多种方法对其进行优化。本文采用第四章介绍的几种重要的CUDA程序 优化方法——维度划分优化、存储器访问优化、指令流优化以及综合优化方法分别对基 于GPU的粒子沉降模拟程序进行进一步的优化,实验结果证明优化后的程序运行效率有 了进一步的提高。其中属综合优化效果最为明显,最终获得了71倍多的加速比。实现粒 子沉降模型LBM模拟的加速,为其更广泛的应用于实际生活中奠定了基础,也推动了 GPU通用并行计算技术应用于更多实际问题的发展进程。 关键词:晶格Boltzmann方法;CUDA;GPU;粒子沉降;优化 II Abstract GPU

您可能关注的文档

文档评论(0)

dahunjun + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档