基于自主计算的集群管理软件的设计与实现.pdfVIP

基于自主计算的集群管理软件的设计与实现.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于自主计算的集群管理软件的设计与实现.pdf

中国高等教育学会教育信息化分会第几次学术年会论文集 ·332· 基于自主计算的集群管理软件的设计与实现 李云春1,张德生2,李强1 (1.北京航空航天大学,计算机学院,网络技术北京市重点实验室;2.北京航空航火大学,网络信息与汁算中心,北 京,100083) 摘要:服务器集群已经成为普遍使用的高性能计算环境,随着集群节点数量和应用规模增大,对于集群计算环境和应 用系统的管理变得越来越复杂,IBM提出的自主计算思想为集群的系统管理提供J,一条行之有效的途径。论文分析了 集群管理领域的研究现状以及自主计算的相关概念和技术,在分析集群计算环境管理需求的基础上,给出了一种以 JMX管理标准为基础的基于规则的自丰管理体系结构,并设计了节点代理服务模块和管理服务器的功能结构。论文提 出了一种基于自主计算技术的集群节点监控管理服务机制,给出了基于规则语言的管理决策引擎的实现方法,最后, 论文通过在浪潮天梭TSl0000集群服务器的自主Tomcat集群的自恢复控制实例,验证了该软件的可用性和有效性, 并对下一步的研究方向进行了探讨。 关键字:集群管理:自丰计算;JMX 1引言6 随着基于计算机网络的分布式计算技术的发展,计算成为科学研究的新手段,各研究领域对于计 算能力需求的不断增加,集群计算以其高性能价格比和高可靠性己经成为普遍使用的高性能计算环 境。中国软件行业协会数学软件分会和国家863高性能计算机评测中心联合公开发布的2005和2006 年中国高性能计算机性能TOP排行榜【l】统计数据表明,集群占据了我国高性能产品和应用的90%份 额。一般来说,根据集群的用途和不同特征,集群可以分为两种类型:高可用集群和高性能集群。高 可用集群主要用于商业计算,提供高度可靠的商业服务;高性能集群则主要用于科学计算,提供高性 能计算能力。集群的优势在于使用没有单点故障的体系结构来达到系统的高可用性和高可伸缩性,并 且使用通用标准的计算机。然而,随着集群节点数量的增加和规模不断扩大,集群计算环境的管理和 维护变得越来越复杂。 监测软件项目,它采用多播侦听和通知协议监测集群节点的状态,并在集群之间采用点到点的树状连 接来汇聚所有节点的状态信息,这种树状分层结构使得它可以方便扩展到多个服务器集群。Ganglia 最大的优点就是实现了树形结构中的叶子节点的冗余,每个叶子节点可以动态更新接收的其它节点状 态信息,并在某节点失效时因为超时而导致此节点失效,通过这种方式可以动态增加和删除节点。但 是Ganglia存在明显的缺陷,他没有解决非叶子节点的容错,当部署有汇聚进程的汇集节点或与之相 Linux内核信息监测采集模块、节点数据服务模块以及监控信息汇集中心。其采用C/S的分层结构, 的监测数据。SuperMon最大的优点是采用内核信息采集模块,可以快速有效地采集数据,并且采用 统,并且可以定制资源监测模块,但是客户端工具还不太完善。其它还有一些项目如美国Kansas州 6 ttI·一五”863 il划信息技术领域重大项目:高效能计算机系统研制及关键技术研究2007AA01A127 中国高等教育学会教育信息化分会第九次学术年会论文集 ·333· 究较集中于系统中集群节点的资源监测部分,仅仅是对某些系统性能指标的参数显示,而没有研究更 进一步的统计分析和管理控制功能,尤其是缺乏自主管理能力,随着百万亿次计算机集群的出现,系 统中的组件成倍增加,在集群管理中应用自主计算技术提供了新的途径。 2ACMS框架结构 2.1ACMS组织模型 ACMS软件采用多级分层式组织模型,将集群系统划分为多个组,每个组的监控信息先汇聚到中 间汇集节点上,管理服务器只需要同少量的中间汇集节点通信就可以采集到所有节点的监控信息。如 节点代理服务通信。 图1ACMS组织模型 2.2ACMS自主管理模型 IBM公司高级副总裁PaulHom于2001年在哈佛大学做主体报告时提出自主计算的概念,其动机 是试图通过“技术管理技术”,思想起源于人体的植物神经系利21。植物神经系统可在无大脑意识的条 件下自动的管理人体局部,例如在跑步的情况下植物神经系统可自动调节心跳频率、呼吸频率等体征, 而不需人脑意识的干预,减轻人脑的管理工作

文档评论(0)

开心农场 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档