基于集群系统硬件监控技术机房管理解决方案.docVIP

基于集群系统硬件监控技术机房管理解决方案.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于集群系统硬件监控技术机房管理解决方案

基于集群系统硬件监控技术机房管理解决方案   摘要:计算机集群系统的硬件监控问题一直是大型集群系统管理中普遍存在且急需解决的问题。我院学生机房也不堪其扰。首先,开发满足需求的监控软件的代价太大且缺乏OS底层技术的支撑,其次依靠人工巡查费力、耗时、不安全。本文基于WEB服务器技术以及IPMI协议提出并讨论了解决计算机集群系统监控问题的二种解决方案,最后确定了第二种基于依次轮询的解决方案解决我院学生机房硬、软件监控问题。   关键词:集群系统;硬件监控;机房管理;方案   中图分类号:G647 文献标志码:A 文章编号:1674-9324(2013)36-0009-03   随着计算机和网络技术的飞速发展,应用领域中计算机系统的规模和数量已经不可以与网络发展初期的小型网络同日而语。由此产生的管理问题也越来越受到人们的关注——这些计算机系统需要一个分离于计算机本身内部系统的监控系统来对计算机集群系统进行监控以保证集群系统的正常运行。   一、基于集群系统硬件监控技术的发展现状   20世纪80年代以来,随着计算机技术的不断发展和工业自动控制的需求,计算机监控技术取得了长足的发展。从原有的计算机直接控制,到大量涌现的Microsoft的DCOM、Sun的RMI、OMG(对象管理组织)的CORBA,DCOM、RMI、CORBA等为代表的远程计算机程序监控技术,再到后期发展到基于web服务器的远程页面式监控系统,计算机监控在向着无缝链接和跨平台化发展,为用户提供更能适应各种不同计算机环境,各种不同监控距离以及简洁使用的监控系统[1]。现阶段web服务器以其标准性和开放性即将已经成为大规模计算机远程监控的主流。这对计算机远程监控也提供了更有利的发展环境。任何支持http和html等标准的计算机设备都可以通过web服务器对大规模计算机硬件甚至于对各种工业设备的监控,这样不但可以实时地监测到设备的最新信息,还能及时地对设备进行有效的控制。基于web服务器的硬件监控技术,在工业以及国防领域已经得到了比较广泛的应用和发展。   二、学生实验机房管理的现状以及应对策略   随着我院学科建设的健全和发展,我院机房已成为我系的信息枢纽、控制??纽和资料库。我院实验室机房现有6个实验室,总计近千台计算机,年接待学生310000人时数。在管理上有如硬件安全管理,计时管理,技术人员管理,学生实验课课堂纪律管理等多处监控难点。如何管理、监控这些大规模集群系统,保证系统的正常有序运行成为目前我系计算机机房管理的重点研究问题。目前我院机房的管理人员不得不采用24小时专人值班,定时巡查机房环境设备,这样不仅加重了管理人员的负担,而且更多的时候,不能及时排除故障,对事故发生的时间及责任也无科学的管理和认定。   综上,我院机房需要有效的方法来实时监控硬件运转信息,包括对计算机的启动、停止与复位,显示各个设备工作的环境温度、电压、电流等信息。现阶段硬件监控系统由最初的单个设备配备监控系统发展到成组的客户/服务端机制以及到后来的大规模信息收集处理,硬件监控系统已经实现了很高的控制效率并在很多应用领域得到推广、运用。   本文针对我院机房实际提出并讨论二套基于web的硬件监控系统的可行性解决方案。   三、两种基于web服务器的硬件监控系统的两种解决方案   1.基于分布汇总的解决方案。基于分布汇总的解决方案如图一所示,采用的是基于C/S软件系统架构方式,在集群系统的每一台主机上安装客户端程序,由客户端程序收集主机的硬件运转信息,发送到服务器端程序负责决策是否发出报警,从而达到硬件监控的目的。这种方式降低了web服务器方的负载,使得服务器端程序只需要对异常信息进行处理,提高了web服务器的处理速度。在这种模式下,客户端程序也可以部署分布式数据库,定期收集、监控集群的硬软件运转信息,定期通过网络汇总到web服务器方的数据库,使得即使在短暂的网络不通畅的状态下,客户端仍可以对单个硬件进行监控。   2.基于依次轮询的解决方案以及IPMI协议。(1)基于依次轮询的解决方案。另外一种基于依次轮询的解决方案如图二所示,采用B/S软件系统架构,在web服务器端开发API多线程程序,当程序运行时建立相应线程依次定期询问集群系统中各个主机系统的OS内核API程序接口,或访问由IPMI协议支持的串口获得各个主机系统软硬件资源的运转情况,统一将监控数据汇总到位于web服务器端的数据库中,由服务器端程序到数据库中读取整个集群系统内每台主机的运转情况。在这种解决方案中,在集群系统的各个主机上均可登陆到web服务器端对整个计算机集群系统进行实时监控。由于这种方案不需要在集群中每台机器上安装客户端软件,在网络通畅的前提下可以自由灵活地登陆web服务器端查看集群系统运转情况,实

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档