- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2009 年 第 54 卷 第 20 期: 3177 ~ 3184
SCIENCE IN CHINA PRESS
Nvidia/AMD GPU
*
, , , , , , , , ,
, , 100190;
, 100049
* , E-mail: wge@
2009-06-24 收稿, 2009-09-16 接受
国家重大科研装备研制项目(编号: ZDYZ2008-2)、国家自然科学基金(批准号: 和中国科学院知识创新工程项目(编号:
KGCX2-YW-124)资助
摘要 利用图形处理单元(graphic processing unit, GPU)进行通用计算近年来得到关注, 关键词
Nvidia 和AMD 公司已推出了各自的开发环境CUDA 和ASC. 很多计算在GPU 上的速度远 GPGPU
高于目前的CPU. 格子玻尔兹曼方法(lattice Boltzmann method, LBM)作为一种网格上的粒子
Nvidia
方法, 对流动模拟具有良好的内在并行性, 非常适合利用GPU 进行大规模并行计算. 本文提 AMD
出了一种耦合Nvidia 和AMD 的两类GPU 完成LBM 凹槽流模拟的算法, 对于两类GPU, 在
LBM 的 D2Q9 模型下分别设计了相应的算法和程序, 之后利用消息传递接口(message
passing interface, MPI)协议通过多程序多数据流(multi-program multi-data, MPMD)模式使其
能够联合计算, 以充分发挥混合GPU 集群系统的性能. 通过GPU 和CPU 程序结果的比较,
证实了GPU 计算的正确性和所能带来的显著的加速比, 为建设通用大规模GPU 并行计算平
台提供了重要参考.
, , (lattice Boltzmann method,
(graphic processing unit, GPU) LBM)20 80
. GPU [3].
. (computational fluid dynamics, CFD) ,
, LBM ,
GPU ,
. , , ,
, GPU , .
. 2007 , Nvidia , LBM
GPU(general purpose GPU, GPGPU) ,
CUDA(compute unifie
文档评论(0)