- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
???
动态网格的DSMC方法在GPU上的并行??
??Supported by NVIDIA Corporation
+作者简介: 文敏华(1988-),男,江西会昌人,硕士,主要研究领域为高性能计算;林新华(1979-),男,浙江绍兴人,硕士,上海交大高性能计算中心副主任,主要研究领域为高性能计算; Simon Chong Wee See(1966-),男,新加坡人,博士,NVIDIA公司亚太区首席技术总监,上海交大高性能计算中心科学计算总监,主要研究领域为高性能计算。
文敏华1+, 林新华1, Simon Chong Wee See 1,2
1(上海交通大学 高性能计算中心,上海 200240)
2(NVIDIA Corporation)
A GPU Based Parallel Method For Dynamic Collision Grid DSMC
WEN Minhua1+, LIN Xinhua1, Simon Chong Wee See 1,2
1(High Performance Computing Center, Shanghai Jiao Tong University, Shanghai 200240, China)
2(NVIDIA Corporation )
+ Corresponding author: Phn: +86-, E-mail: wenminhua@sjtu.edu.cn
Abstract: The Direct Simulation Monte Carlo (DSMC) method is a powerful computational tool in the field of rarefied gas dynamics. However, there are two main shortages of DSMC method: one is complex gridding processing and the other is its large time consumption. The dynamic collision grid DSMC method generates collision grids adaptively according to the flowfield, which overcomes the first shortage. For the other shortage, we port the dynamic collision grid DSMC method to GPU using CUDA. During our parallel implement, the main computation is performed on GPU while CPU only deals with the processes of initialization and output. A two-dimensional benchmark problem in different sizes is used to demonstrate the correctness of the parallelization. The results show that 10+X speedup is achieved based on NVIDIA Fermi C2050. For a same case, the performance on NVIDIA’s newly released Kepler K20 is 1.3-1.6x higher than that on Fermi C2050.
Key words: CUDA, GPU, Dynamic Collision Grid DSMC, Parallel Simulation
摘要:直接模拟蒙特卡罗方法(Direct Simulation Monte Carlo,DSMC)是稀薄气体动力学领域的重要工具。然而,DSMC方法有两个比较主要的缺点:一是复杂的网格处理,另一个是庞大的计算量。使用动态网格的DSMC方法可以根据流场信息,动态生成自适应的碰撞网格,能有效解决前一个缺点;针对后一个缺点,本文则基于动态网格的DSMC方法,使用CUDA编写并行程序,将其移植到GPU上以减少计算时间。在并行实现中,GPU负责绝大部分的计算,而CPU只负责初始化、结果输出等少量工作。我们使用一个二维超音速横掠平板问题作为算例验证了并行程序的正确性。对于不同规模的算例,在NVIDIA Fermi C2050之上均获得了10倍以上的加速比;对于相同算例,NVIDIA最新发布的Kepler K20上的速度约为
您可能关注的文档
- 以最经济的方式实现对铁前有害元素的控制.doc
- 优化hα-syn基因疫苗预防注射对MPTP急性帕金森病小鼠的神经保护作用.doc
- 优化城市规模推动经济增长.PDF
- 优化分类型神经网络线性集成.PDF
- 优化管理提高随书光盘资源利用率.PDF
- 优化国土空间开发格局研究.PDF
- 优化海兔肝蛋白质组提取与分离技术.PDF
- 优化灰导数白化值的GM(建模法.PDF
- 优化滤波方法及其在中国大陆布格重力异常数据处理中的应用.PDF
- 优化水冷壁辐射特性节能技术在135MW机组锅炉上的应用.doc
- springbooot+vue基于java的房屋维修系统毕业论文.doc
- 中国消防救援学院《单片机系统实验》2023-2024学年第一学期期末试卷.doc
- 2025年溧阳纺织化学品项目申请.pptx
- 景区门票包销合同模板(3篇).docx
- 【股票技术指标学习指南】第七章第三节货币需要量的测算.doc
- 2025春 _ 人教版七年级英语下册【unit4】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit5】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit6】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit7】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit8】看音标写单词.doc
最近下载
- 敬老院运营与管理规范.docx VIP
- DB31_T 1598-2025 __城市轨道交通车辆寿命评估通用要求.pdf
- 分户验收方案 .doc VIP
- 液力變矩器的结构.doc VIP
- 2025年内蒙古自治区公安机关留置看护监管机构(专业知识)考试试题【含答案】.pdf VIP
- 一汽-大众-迈腾MAGOTAN-产品使用说明书-新一代迈腾330TSI DSG尊贵型-FV7187BBDBG-MagotanB8L-201606.pdf
- 液态氢风险分析.docx VIP
- TCAAA051-2020湖羊规范合格.pdf VIP
- 地震救援 地震八大救援知识 .docx VIP
- 牛根生致中国企业家俱乐部理事及长江商学院同学的一封信Microsoft Word.doc VIP
文档评论(0)