完整word版,高性能计算集群(HPCCLUSTER).docxVIP

下载本文档

34
0
约1.08万字
约 7页
2020-11-18 发布于山东
举报
版权申诉

完整word版,高性能计算集群(HPCCLUSTER).docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

高性能计算集群 (HPC CLUSTER) 1.1 什么是高性能计算集群 ? 简单的说，高性能计算 (High-Performance Computing) 是计算机科学的一个分支，它致力于开发超级计算机，研究并行算法和开发相关软件。高性能集群主要用于处理复杂的计算问题，应用在需要大规模科学计算的环境中，如天气预报、石油勘探与油藏模拟、分子模拟、基因测序等。高性能集群上运行的应用程序一般使用并行算法，把一个大的普通问题根据一定的规则分为许多小的子问题，在集群内的不同节点上进行计算，而这些小问题的处理结果，经过处理可合并为原问题的最终结果。由于这些小问题的计算一般是可以并行完成的，从而可以缩短问题的处理时间。高性能集群在计算过程中，各节点是协同工作的，它们分别处理大问题的一部分，并在处理中根据需要进行数据交换，各节点的处理结果都是最终结果的一部分。高性能集群的处理能力与集群的规模成正比，是集群内各节点处理能力之和，但这种集群一般没有高可用性。 1.2 高性能计算分类高性能计算的分类方法很多。这里从并行任务间的关系角度来对高性能计算分类。 1.2.1 高吞吐计算 (High-throughput Computing) 有一类高性能计算，可以把它分成若干可以并行的子任务，而且各个子任务彼此间没有什么关联。因为这种类型应用的一个共同特征是在海量数据上搜索某些特定模式，所以把这类计算称为高吞吐计算。所谓的 Internet 计算都属于这一类。按照 Flynn 的分类，高吞吐计算属于 SIMD （Single Instruction/Multiple Data, 单指令流 -多数据流）的范畴。 1.2.2 分布计算 (Distributed Computing) 另一类计算刚好和高吞吐计算相反，它们虽然可以给分成若干并行的子任务，但是子任务间联系很紧密，需要大量的数据交换。按照 Flynn 的分类，分布式的高性能计算属于 MIMD （Multiple Instruction/Multiple Data ，多指令流 -多数据流）的范畴。 1.3 高性能计算集群系统的特点可以采用现成的通用硬件设备或特殊应用的硬件设备，研制周期短；可实现单一系统映像，即操作控制、 IP 登录点、文件结构、存储空间、 I/O 单一化；空间、作业管理系统等等的高性能（因为 CPU处理能力与磁盘均衡分布，用高速网络连接后具有并行吞吐能力）；高可用性，本身互为冗余节点，能够为用户提供不间断的服务，由于系统中包括了多个结点，当一个结点出现故障的时候，整个系统仍然能够继续为用户提供服务；高可扩展性，在集群系统中可以动态地加入新的服务器和删除需要淘汰的服务器，从而能够最大限度地扩展系统以满足不断增长的应用的需要；安全性，天然的防火墙；资源可充分利用，集群系统的每个结点都是相对独立的机器，当这些机器不提供服务或者不需要使用的时候，仍然能够被充分利用。而大型主机上更新下来的配件就难以被重新利用了。具有极高的性能价格比，和传统的大型主机相比，具有很大的价格优势； 1.4 Linux 高性能集群系统当论及 Linux 高性能集群时，许多人的第一反映就是名的科学计算集群系统。以后的很多集群都采用 Beowulf 。起初， Beowulf 只是一个著 Beowulf 类似的架构，所以，实际上，现在 Beowulf Beowulf 已经成为一类广为接受的高性能集群的类型。尽管名称各异，很多集群系统都是集群的衍生物。当然也存在有别于 Beowulf 的集群系统， COW 和 Mosix 就是另两类著名的集群系统。 1.4.1 Beowulf 集群简单的说， Beowulf 是一种能够将多台计算机用于并行计算的体系结构。通常 Beowulf 系统由通过以太网或其他网络连接的多个计算节点和管理节点构成。管理节点控制整个集群系统，同时为计算节点提供文件服务和对外的网络连接。它使用的是常见的硬件设备，象普通 PC、以太网卡和集线器。它很少使用特别定制的硬件和特殊的设备。 Beowulf 集群的软件也是随处可见的，象 Linux 、 PVM 和 MPI 。 1.4.2 COW 集群象 Beowulf 一样， COW （ Cluster Of Workstation ）也是由最常见的硬件设备和软件系统搭建而成。通常也是由一个控制节点和多个计算节点构成。 COW COW 和 Beowulf 的主要区别在于：中的计算节点主要都是闲置的计算资源，如办公室中的桌面工作站，它们就是普通的 PC，采用普通的局域网进行连接。因为这些计算节点白天会作为工作