MPI／OpenMP＋CUDA高性能计算环境的配置及应用.pdfVIP

下载本文档

183
0
约9.93千字
约 3页
2015-09-15 发布于重庆
举报
版权申诉

MPI／OpenMP＋CUDA高性能计算环境的配置及应用.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

MPI／OpenMP＋CUDA高性能计算环境的配置及应用,openmpcuda,mpiopenmp,mpi和openmp,openmp与mpi的区别,openmpmpi混合,mpicuda,gpu高性能运算之cuda,cuda高性能编程,eclipse配置openmp

VA 一lj 技【术应用】 MPI／OpenMP+CUDA高性能计算环境的配置及应用田刚卢风顺0 (1．陕西省行政学院陕西西安 710068：2．国防科学技术大学计算机学院湖南长沙 410073) 摘要： GPU具有优秀的浮点计算性能以及很高的存储带宽，是组建异构机群的首选加速处理器。在分析异构高性能机群典型体系结构的基础上。详细描述如何搭建CPU／GPU异构并行计算环境，并提出相应的程序设汁框架。以国际上公认的并行程序测试集NPB为例，验证所提出的程序设计框架的有效性。关键词 GPU；MPI；OpenMP：CUDA；NPB 中图分类号：TP31111 文献标识码：A 文章编号：1871--7597(2011)0910118--02 0引曹在分布式内存环境下，MPI(MessagePassingInterface)是消息传 3O多年来，随着半导体和制造工艺的飞速发展以及处理器体系结构的递接口的业界标准。从1994年5月发布以来，目前已经有MPI一1和MPI-2两不断演化，处理器的性能不断提高。具体来说，CPU的性能增长方式已从种标准，分别有多种具体的实现。如MPIcH[5】、LAM等。作为目前分布式单纯增加时钟频率转变为增加核心的数日：由于游戏市场以及高性能计算存储体系上的主流编程模型，MPI已与C、c++、Fortran等主要高性能计算领域的驱动，GPU已经发展成为一种高度并行化的众核处理器，具有优秀编程语言进行了绑定，且被所有的并行计算机制造商支持。的浮点计算性能以及很高的存储带宽，且其可编程性也获得很大改善。目以广泛使用的MPICH实现为例来说明MPI环境的配置方法：1)针对操前，已有很多基于CPU／GPU异构体系结构的机群系统，如国防科学技术大作系统的类型，下载最新的稳定版本MPICH2—1．3．2，主要由美国的学研制的Tianhe一1A[1]。甚至有专家预言，未来的高性能计算平台将会成 Argonne国家试验室开发：2)按照指南安装程序i3)配置环境变量为以异构混合体系结构为主的格局。 PATH以及LOLIBRARY— PATH。高性能计算平台的异构性给并行应用程序的开发提出了很大的挑战。 1．20penMPt；~境配置针对不同的处理器类型，必须借助合理的编程模型来开发并行程序。对于 OpenMP是共享存储系统编程的一个工业标准，由制导指令、运行库多核CPU而言，一般采用MP[[2]、OpenMP[3]或者MPI／OpenMP混合编程模型和环境变量三部分构成，其最新规范为3．0[6]。目前OpenMP已被许多编译来设计并开发并行应用。随着CPU核心数日的不断增加，单纯采用MPI或者器提供商支持，从而使共享内存平台间的可移植并行计算成为可能 OpenMP均很难达到良好的性能，而MPl／OpenMP混合模型可能会成为一个较 OpenMP不是单独的库，无需安装，目前已被主流的编译器支持。借助好的选择。对于众核GPU而言，硬件厂商提供了专f1针对其产品的编程模 OpenMP进行并行程序设计时，编程人员需要手动添加制导语句来告知编译型，如NVIDIA的CUDA[4J。器：I)程序中可并行执行的部分；2)特定的程序段由具体哪个线程负责针对现有的CPU／GPU异构高性能计算平台，重新设计一个并行程序编执行；3)各线程问的通讯关系等程框架很困难：因此，可以尝试将现有的编程模型有机地耦合起来，构成 1．3CUDA环境配置一个可行的并行编程模型本文