- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于GPU的并行集群系统的发展.doc
基于GPU的并行集群系统的发展 摘 要:基于GPU的并行集群系统的各类产品遍布我国的生产,生活。本文将介绍GPU的并行集群的技术和其在我国的发展状况。 关键词:GPU;集群;并行集群 中图分类号:TP319 1 前言 GPU集群的高性能主要归功于其大规模并行多核结构、多线程浮点算术中的高吞吐量,以及使用大型片上缓存显著减少了大量数据移动的时间。我们可以这样说:GPU集群比传统的CPU集群具有更好的成本效益。GPU集群不仅在速度性能上有巨大飞跃,而且显著降低了对空间、能源和冷却的要求。 2 GPU集群 图形处理器GPU善于处理大规模密集型数据和并行数据,通用并行架构CUDA让GPU在通用计算领域越来越普及。基于GPGPU的高性能计算主要应用与云计算吧,企业对成本以及效率的要求越来越高,随着产品的不断升级,越发的对横向和纵向都提出了更高的要求,横向要求平台化流程化自动化,纵向要求产品自身性能高端。服务器的稳定非常重要,一旦出现崩溃等重大异常,将对企业的应用生产和交付产生巨大的影响。管理GPU集群有助于实现最高的GPU利用率以及帮助用户获得最佳性能。GPU集群的构建采用了大量的GPU芯片。在一些Top500系统中,GPU集群已经证实能够达到Pflops级别的性能。大多数GPU集群由同构GPU构建,这些GPU具有相同的硬件类型、制造和模型。GPU集群的软件包括操作系统、GPU驱动和集群化API,如MPI。由于GPU集群的高性价比,高性能计算领域中GPU集群的使用越来越普遍。 GPU集群相较于CPU集群,能够在使用较少操作系统镜像的情况下正常工作。在电力、环境和管理复杂性方面的降低使得GPU集群在未来高性能计算应用中非常有吸引力由于GPU集群的高性价比,高性能计算领域中GPU集群的使用越来越普遍,但GPU集群并行编程并没有一个标准的通信模型,绝大多数集群应用采取CUDA+MPI的方法实现,而CUDA和MPI编程都非常困难,需要程序员了解GPU硬件架构和MPI消息传递机制,显式控制内存与显存、节点与节点间的数据传输。因此,对编程人员来说,GPU集群并行编程仍是一个复杂的问题。 3 GPU的并行集群 目前很成功的产品出现在市场上,如: (1)Platform HPC由Platform Computing公司开发,旨在让技术应用程序的用户能够轻松利用GPU高性能计算集群的处理能力和扩展能力。Platform HPC则在一款产品中包含了完整、统一的全套管理功能,这些功能让开发者能够轻松利用高性能集群的处理能力和扩展能力,从而可缩短系统就绪时间、提高用户生产率以及实现最佳吞吐量。如图所示Platform HPC操作界面 (2)BrightClusterManager是一款完全集成的解决方案,用于部署、测试、提供(provisioning)、监控以及管理GPU集群。BrightClusterManager可以从支持的GPU和GPU计算系统采样并监控这些衡量指标,这类GPU和计算系统包括英伟达TeslaC2050和C2070GPU计算卡以及英伟达TeslaS2070机架型GPU计算系统。凭借BrightClusterManager,集群管理员能够同时轻松安装和管理多个集群。如图所示BrightClusterManager操作界面 (3)PBSProfessional是Altair公司的EAL3+安全认证商用级高性能计算工作负荷管理解决方案。PBS Professional是所有PBS Works解决方案的基础,让开发者能够轻松创建智能政策,以管理分布式多厂商计算资产。 (4)BrightClusterManager是一款完全集成的解决方案,用于部署、测试、提供(provisioning)、监控以及管理GPU集群。凭借Bright Cluster Manager,集群管理员能够同时轻松安装和管理多个集群。 (5)Ganglia是一款开源可扩展分布式监控系统,用于集群与网格(Grid)等高性能计算系统。该系统经过了精心的工程设计,可让每个节点实现极低的系统总开销以及极高的并发性。Ganglia目前已运用在全球数以千计的集群当中,该系统可以扩展,能够处理具备数千个节点的集群。 (6)吉浦迅科技与英伟达(NVidia)、惠普(HP)共同合作推出的HPGPUStarterKit超算集群测试环境,提供最高四节点/8-GPU/4096核,浮点计算能力高达10万亿次的测试环境,针对国内高校、科研单位能够快速体验超强的运算速度。 4 结束语 GPU集群比传统的CPU集群具有更好的成本效益。GPU集群不仅在速度性能上有巨大飞跃,而且显著降低了对空间、能源和冷却的要求。搭建CPU-GPU集群并行计算平台,集群中每个计算节点都以CPU为主处理器GPU为协处理器,将并行数值计
文档评论(0)