- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
MPI/OpenMP+CUDA高性能计算环境的配置及应用,openmpcuda,mpiopenmp,mpi和openmp,openmp与mpi的区别,openmpmpi混合,mpicuda,gpu高性能运算之cuda,cuda高性能编程,eclipse配置openmp
VA 一lj 技【术应用】
MPI/OpenMP+CUDA高性能计算环境的配置及应用
田 刚 卢风顺0
(1.陕西省行政学院 陕西 西安 710068:2.国防科学技术大学 计算机学院 湖南 长沙 410073)
摘 要: GPU具有优秀的浮点计算性能以及很高的存储带宽,是组建异构机群的首选加速处理器。在分析异构高性能机群典型体系结构的基础上。详细描述如
何搭建CPU/GPU异构并行计算环境,并提出相应的程序设汁框架。以国际上公认的并行程序测试集NPB为例,验证所提出的程序设计框架的有效性。
关键词 GPU;MPI;OpenMP:CUDA;NPB
中图分类号:TP31111 文献标识码:A 文章编号:1871--7597(2011)0910118--02
0引曹 在分布式内存环境下,MPI(MessagePassingInterface)是消息传
3O多年来,随着半导体和制造工艺的飞速发展以及处理器体系结构的 递接 口的业界标准。从1994年5月发布以来 ,目前已经有MPI一1和MPI-2两
不断演化 ,处理器的性能不断提高。具体来说 ,CPU的性能增长方式 已从 种标准,分别有多种具体的实现 。如MPIcH[5】、LAM等。作为 目前分布式
单纯增加时钟频率转变为增加核心的数日:由于游戏市场以及高性能计算 存储体系上的主流编程模型,MPI已与C、c++、Fortran等主要高性能计算
领域的驱动,GPU已经发展成为一种高度并行化的众核处理器,具有优秀 编程语言进行了绑定,且被所有的并行计算机制造商支持。
的浮点计算性能以及很高的存储带宽,且其可编程性也获得很大改善 。目 以广泛使用的MPICH实现为例来说明MPI环境的配置方法:1)针对操
前,已有很多基于CPU/GPU异构体系结构的机群系统,如国防科学技术大 作系统的类型 ,下载最新的稳定版本MPICH2—1.3.2,主要 由美 国的
学研制的Tianhe一1A[1]。甚至有专家预言,未来的高性能计算平台将会成 Argonne国家试验室开发:2)按照指南安装程序i3)配置环境变量
为以异构混合体系结构为主的格局。 PATH以及LOLIBRARY— PATH。
高性能计算平台的异构性给并行应用程序的开发提出了很大的挑战。 1.20penMPt;~境配置
针对不同的处理器类型,必须借助合理的编程模型来开发并行程序 。对于 OpenMP是共享存储系统编程的一个工业标准,由制导指令、运行库
多核CPU而言,一般采用MP[[2]、OpenMP[3]或者MPI/OpenMP混合编程模型 和环境变量三部分构成 ,其最新规范为3.0[6]。目前OpenMP已被许多编译
来设计并开发并行应用。随着CPU核心数 日的不断增加,单纯采用MPI或者 器提供商支持,从而使共享 内存平台间的可移植并行计算成为可能
OpenMP均很难达到 良好的性能,而MPl/OpenMP混合模型可能会成为一个较 OpenMP不是单独的库,无需安装,目前已被主流的编译器支持 。借助
好的选择 。对于众核GPU而言,硬件厂商提供了专f1针对其产品的编程模 OpenMP进行并行程序设计时,编程人员需要手动添加制导语句来告知编译
型,如NVIDIA的CUDA[4J。 器:I)程序中可并行执行的部分;2)特定的程序段由具体哪个线程负责
针对现有的CPU/GPU异构高性能计算平台,重新设计一个并行程序编 执行;3)各线程问的通讯关系等
程框架很困难:因此,可以尝试将现有的编程模型有机地耦合起来,构成 1.3CUDA环境配置
一 个可行的并行编程模型 本文
文档评论(0)