- 1、本文档共66页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
可扩展并行计算集群——火龙果整理
Chapter 2: Computer Clusters for
Scalable parallel Computing
可扩展并行计算集群
Computer School, NUDT. Spring, 2013 1
2.1大规模并行集群
计算机集群(computer cluster)由相互联系的
个体计算机聚集组成,这些计算机之间相互联系并
且共同工作
对于用户来说,计算机集群如同一个独立完整的
计算资源池。
集群化实现作业级的大规模并行,并通过独立操
作实现高可用性。
计算机集群和大规模并行处理器(MPP)的优点包
括可扩展性能、高可用性、容错、模块化增长和使
用商用组件。
Computer School, NUDT. Spring, 2013 2
计算机集群的设计宗旨:
可扩展性:计算机集群化是基于模块化增长的概
念. 将几百个单处理器节点的集群扩展为10 000个
多核节点的超级集群。这一些因素限制: 如多核心
芯片技术、集群拓扑结构、封装方式、电力消耗和
冷控制技术应用。
封装:集群节点可以被封装成紧凑或者松散的形
式。封装直接影响通信线路的长度,需要选择合适
的互连技术。紧凑集群通常利用专有的高带宽、低
延迟的通信网络,而松散集群节点一般由标准的局
域网或广域网连接。
Computer School, NUDT. Spring, 2013 4
控制:集群能够以集中或分散的形式被控制或管理。
紧凑集群通常集中控制,而松散集群可以采取另一种
方式。在集中式集群中,中心管理者拥有、控制、管
理和操作所有节点。在分散式集群中,节点有各自的
拥有者。它同样需要进程调度、负载迁移、检查点、
记账和其他类似任务的特殊技术。
同构性:同构集群采用来自相同平台的节点,即节
点具有相同处理器体系结构和相同操作系统。异构集
群使用来自不同平台的节点。互操作性是异构集群的
一个非常重要的问题。在同构集群中,二进制进程镜
像可以迁移到另一个节点并能够继续执行。这在异构
集群中是不允许的,因为当进程迁移到不同平台的节
点上时,二进制代码不继续执行。
Computer School, NUDT. Spring, 2013 5
安全性:集群内通信可以是开放的或封闭的。开放
集群外界机器可采用标准协议(如TCP/IP)访问通
信路径,从而访问单独节点。有几个缺点:集群内
通信变得不安全; 外界通信可能以不可预测的形式干
扰集群内通信; 准通信协议往往具有巨大的开销。在
封闭集群中,集群内通信与外界相隔离,目前还没
有高效、封闭的集群内通信标准。
专用集群和企业集群:专用集群由相同类型的计算
机节点同构配置,被用于代替传统的大型机或超级
计算机,极大地提高了吞吐量,并且减少了响应时
间。企业集群主要利用节点的闲置资源,每个节点
通常是一个完整的SMP 、工作站或PC及其所有必要
的外部设备。通常是由异构计算机节点配置的。
Computer School, NUDT. Spring, 2013 6
基础集群设计问题:
可扩展性能:资源扩展(集群节点、内存容量、
I/O带宽等)使性能成比例增长
单系统镜像(SSI):集群是一个单一独立的
系统。
可用性支持:集群能够利用处理器、内存、磁
盘、I/O设备、网络和操作系统镜像的大量冗余
提供低成本、高可用性的性能。
集群作业管理:实现高系统利用率,作业管理
软件需要提供批量、负载均衡和并行处理等功能。
Computer School, NUDT. Spring, 2013 7
节点间通信:集群由于具有更高的节点复
杂度,故不能被封装得如MPP节点一样的简洁。
集群内节点之间的物理网线长度比MPP长。
容错和恢复:机器集群能够消除所有的单
点失效
文档评论(0)