GPU并行计算在粒子沉降晶格玻尔兹曼模拟中的应用与优化Application and optimization of GPU parallel computing in Boltzmann simulation of particle settling lattice.pdfVIP
- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
GPU并行计算在粒子沉降晶格玻尔兹曼模拟中的应用与优化Application and optimization of GPU parallel computing in Boltzmann simulation of particle settling lattice
GPU并行计算在粒子沉降晶格玻尔兹曼模拟中
的应用与优化
专业名称:计算机应用技术
申请人:党任亚
指导教师:张超英
论文答辩委员会
嫡躯。、势i薜:叁羔!垄堑
委员:瀣鲎
!熊拯
≥
摘要
GPU并行计算在粒子沉降晶格玻尔兹曼模拟中的应用与优化
研究生姓名:党任亚 导师姓名:张超英 学科专业: 计算机应用技术
研究方向:智能计算 年级:2011级
||UlI l Ul I I IIIIII I l UI
摘要
粒子沉降运动在自然界中是一种很常见的现象,而且这一运动现象也广泛存在于众
多领域中,例如工业应用、生命科学、环境科学和医学科学等。因此,近年来对粒子沉
降这一现象的研究引起了许多学者的关注。由于粒子沉降涉及复杂的计算,人们无法采
用理论的方法将其求解,而实验的方法也受到了种种阻碍。随着数值计算方法的兴起,
给粒子沉降现象的模拟带来了希望,而目前在流体力学领域应用比较多的数值模拟方法
Boltzmann
就是晶格玻尔兹曼方法(Lattice Method,LBM)。
LBM是近年发展起来的一种新流体力学计算方法,它算法较为简单,又易于处理复
杂边界,并且还具有天然的并行性,非常适合大规模的并行计算。因此被广泛用来数值
模拟各种复杂流体力学问题。关于LBM,在本文的第二章有简要介绍。本文采用LBM方
法建立了单粒子的粒子沉降二维动力学模型,利用所建模型数值模拟单粒子在流体中的
二维沉降运动。
通过运用LBM,目前对粒子沉降现象的研究已经有了很大的进展,但大多数仅仅只
是实现对各种粒子沉降运动的模拟,却没有人考虑其模拟的效率问题。由于粒子沉降模
型之复杂,数据量之大,当模型规模比较大时,模拟所耗时间就会相当长从而导致效率
低下。在当今高速发展的社会,效率是一个很重要的因素。粒子沉降现象是可以被广泛
运用的,因此对该模型的模拟进行加速,提高其效率非常有必要。本文的研究重点就是
如何提高粒子沉降模拟效率。
虽然LBM有着天然的并行性,但也只是相对于传统的数值模拟方法有了一些改进,
为了使其模拟过程更加高效,本文采用了近年发展并迅速流行起来的方法——在CUDA
的并行性完美结合,达到最佳效果。关于GPU和CUDA,在第三章有简要的介绍。
算方法的可行性和高效性,然后再在CUDA框架下设计并实现了粒子沉降运动在GPU上
模拟计算,实验结果证明在GPU上进行基于LBM的粒子沉降运动数值模拟的并行计算是
摘要
完全可行的,其模拟结果与在CPU上进行模拟的结果完全一致,而且还可以获得非常可
观的加速性能。
虽然基于GPU的并行计算大大提高了程序运行效率,但我们并不满足于此,在此基
础上还可以通过多种方法对其进行优化。本文采用第四章介绍的几种重要的CUDA程序
优化方法——维度划分优化、存储器访问优化、指令流优化以及综合优化方法分别对基
于GPU的粒子沉降模拟程序进行进一步的优化,实验结果证明优化后的程序运行效率有
了进一步的提高。其中属综合优化效果最为明显,最终获得了71倍多的加速比。实现粒
子沉降模型LBM模拟的加速,为其更广泛的应用于实际生活中奠定了基础,也推动了
GPU通用并行计算技术应用于更多实际问题的发展进程。
关键词:晶格Boltzmann方法;CUDA;GPU;粒子沉降;优化
II
Abstract
GPU
您可能关注的文档
- 阴离子表面活性剂层状液晶中制备SAA-LDHs纳米片及其性能研究Study on the preparation of SAA-LDHs nanoscale in the layered liquid crystal of anionic surfactant and its properties.pdf
- 陕西省高等职业教育集团化发展的理论研究与实践探索Theoretical research and practical exploration on the development of Higher Vocational Education Collectivization in Shaanxi.pdf
- 面向参数估计的认知雷达自适应发射波形优化技术研究Research on adaptive transmission waveform optimization of cognitive radar based on parameter estimation.pdf
- 面向多数 强调基础——底线思维下的基础教育音乐课程与教学研究The basic education music curriculum and teaching research under the bottom line thinking.pdf
- 面向欠定混合与动态信源个数的语音盲解卷研究Speech blind deconvolution for undetermined mixture and the number of dynamic sources.pdf
- 高等院校音乐剧人才培养本科课程设置与实施研究Study on the curriculum setting and implementation of musical talent training (undergraduate) in Colleges and Universities.pdf
- AMPK活性对宰后羊肉能量代谢和肉质的影响及其机理研究Study on the effect of AMPK activity on energy metabolism and meat quality of postmortem mutton and its mechanism.pdf
- CCN内容推送转发存储策略研究Research on CCN content push and forward storage strategy.pdf
- EJ339A俘获门控探测器的性能研究Research on performance of EJ339A capture gate detector.pdf
- Flash作品的自动评阅策略研究Study on automatic marking strategy of Flash works.pdf
最近下载
- 2025中国银行中银国际证券股份有限公司招聘8人笔试模拟试题及答案解析.docx VIP
- 神经介入治疗概述及护理常规.ppt VIP
- 舒伯特第二即兴曲,降E大调 D.899之2 Impromptu No. 2 in E flat major, D. 899, No. 2 Op90 Schubert钢琴谱.pdf VIP
- 深潜器钛合金框架结构装配焊接工艺研究-中国造船工程学会.doc
- 村两委工作细则汇编.doc VIP
- 业财融合背景下项目全周期创新管理研究与实践探索.docx VIP
- 《耳穴压豆疗法》PPT课件.pptx VIP
- 设备故障率分析图表(月度).xls VIP
- XXX村两委班子工作职责(最新整理By阿拉蕾).doc VIP
- 四川省雅安市2023-2024学年八年级下学期期末考试数学试题.docx VIP
文档评论(0)