计算机并行运算应用.docVIP

下载本文档

55
0
约3.75千字
约 8页
2018-09-19 发布于福建
举报
版权申诉

计算机并行运算应用.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

计算机并行运算应用

计算机并行运算应用　　摘要并行计算是提高计算机系统计算速度和处理能力的一种有效手段。当前，并行计算经成为解决重大问题的关键，它的基本思想是用多个处理器来协同解决同一问题，即将被求解的问题分解成若干个部分，各部分均由一个独立的处理机来并行计算。本文主要介绍并行运算的应用。　　【关键词】并行计算集群 GPU 定位　　1 并行计算概论　　并行计算（Parallel Computing）是指同时使用多种计算资源解决计算问题的程，是提高计算机系统计算速度和处理能力的一种有效手段。它的基本思想是用多个处理器来协同求解同一问题，即将被求解的问题分解成若干个部分，各部分均由一个独立的处理机来并行计算。　　2 Linux集群的并行计算　　2.1 Linux集群系统　　Linux可以运行在及其普通的PC上，不需要硬件的支持，只要在几台运行的Linux的PC上加入相应的集群软件，就可以组成具有超强可靠性、负载能力和计算能力的Linux集群。Linux集群技术发挥了PC和网络的优势，可以带来很好的性能，结构如图2.1所示。　　2.2 Linux集群下的并行计算　　按照侧重点的不同，可以把Linux集群分为三类：科学集群、负载均衡集群和高可用性集群。科学集群通常涉及为集群开发并行编程应用程序，以解决复杂的科学问题，这是并行计算的基础。负载均衡集群目的是提供和节点个数成正比的负载能力，这种集群适合提供超大访问量的Web服务。高可用性集群的设计思想就是要最大限度地减少服务中断时间。高可用性集群经常使用在多台机器上运行的冗余节点和服务，用来相互跟踪。　　并行计算把进度相对独立的分配于不同的节点，由各自独立的操作系统调度，享有独立的CPU和内存资源（内存可以共享）；通过网络联接的不同计算机的多个进程，进程位于不同的计算机，消息传递是实现进程间通信的唯一方式；消息传递的实现是基于网络socket机制，用户不必关心；进程间可以相互交换信息如数据交换、同步等待，消息是这些交换信息的基本单位。　　2.3 并行性能评测　　加速比和并行效率是最传统的并行算法评价标准，它体现并行机上运行并行算法求解实际问题所能获得的性能。假设最佳串行算法在单处理机上的运行时间为T1 ，T2为并行算法在并行机上使用P台处理机所需时间，T1 与T2 之比为并行计算加速比Sp，并行计算加速比Sp 与P之比定义为相应并行效率。　　采用9台CPU为PIV-1.5GHz内存为512M硬盘配有双网卡的普通PC机作为节点组成Linux集群，实现基于消息传递的分布式内存的并行计算机系统，采用CISCO2900XL系列交换机（24口/100M），将交换机设置为3个虚拟网段，其中的一个网段设置为信息接收网段（LAN1），另一个网段设置为信息发送网段（LAN2）。LAN1只负责接收来自节点计算机的消息，将接收到的消息发送到LAN2的各个端口，LAN2将消息发送到相应的节点计算机，以使各节点计算机的两个网卡分别进行消息的发送和接收，提高消息传递的速度。交换机的第三个网段用于将系统与局域网连接，从而实现远程登陆服务等功能。用MPI程序来测试此集群的性能。测试结果如图2.3所示，横坐标表示参加计算的CPU数目，纵坐标表示CPU所花费的时间。如表2.3所示。　　2.4 结论　　可以看出，当节点数增加到一定个数时，加速比和并行效率反而下降。这是因为随着节点数的增加，通信开销也增加的缘故，所以在并行程序中要减少相互通信，尽量做到负载均衡，这样才能充分利用系统资源。　　3 GPU的高性能并行计算应用　　采用基于CUDA（compute unified device architecture，统一计算设备架构）的GPU（graphic processing unit，图形处理器）与CPU协作处理方法，实现了基于时差最小测量误差的任意站定位算法的实时处理。本方法的处理速度相较于单CPU平台可以提高一至两个数量级，相较于同等处理速度的多CPU平台则体现了开发周期短、费用低、工作量小和可靠性高等众多优势。　　3.1 GPU和CPU 　　近年来，基于CUDA的GPU与CPU协作处理方法开始逐渐成为国内外高性能并行计算领域的热点研究方向。在实际应用中，基于GPU+CPU的协作处理方法体现了高效率、低功耗、小成本的特点。下面根据分布式无源定位系统对高性能并行计算的需求，选择了基于GPU+CPU的协作处理方法并进行实际算法验证。结果表明：同种算法的GPU程序与CPU程序的执行结果相同，性能却有约20倍的提升。基于GPU+CPU的协作处理，CPU进行逻辑运算，GPU进行大量的数学计算。主要优点是：　　（1）并行计算能力强，一块同档次的GPU计算能力相当于一块同