- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CN
43—1258/TP 计算机工程与科学 第35卷第ii期2013年11月
ISSN1007—130X 3
Computer V01.35.No.11.Nov.201
EngineeringScience
文章编号:1007—130X(2013)11—0054—08
多集群计算环境故障监控管理系统。
张 毅,陈 良,庞 剑
(中国空气动力研究与发展中心计算空气动力学研究所,四川绵阳621000)
摘要:随着高性能计算集群系统的数量及其节点规模的不断扩大,系统运行维护的难度和工作量也
随之加大。介绍的软件系统工作在多套不同软硬件环境的Linux集群系统中,采用命令行脚本程序对各
集群中重要的运行状态和指标进行自动监测,并利用socket通信的方式及时将发现的故障信息集中发送
到系统管理员Windows终端,切实提高了系统运行维护工作的效率,加快了故障处理响应时间。该系统
还利用数据库对故障事件数据进行记录管理,规范了故障处理的流程。
关键词:集群;故障;监控;管理;数据库
中图分类号:TP306 文献标志码:A
doi:10.3969/j.issn.1007—130X.2013.11.009
Fault and
monitoringmanagementsystem
for clusters
multiplecomputing
ZHANGYi。CHEN Jian
Liang,PANG
Institute,China 621000。China)
(ComputationalAerodynamics AerodynamicsResearchDevelopmentCenter,Mianyang
Abstract:Withthe numberandscaleof cluster
increasing systems,the
highperformancecomputing
maintenancebecomesmoredifficultandtheworkloadis softwarewe
system gettinglarger.Thesystem
introduceinthe worksin Linuxclusterswithdifferenthardwareandsoftwareenviron—
paper multiple
the
monitors statesandindexesofclusterscommandline
ment,automaticallyimportantoperating by
to in
and sendsfaults theWindowster
您可能关注的文档
- 液压与气压传动项目教程 样章.pdf
- 液压与气压传动项目教程封面+目录.pdf
- 清华(一等奖).pdf
- 点式玻璃幕墙规程.pdf
- 理论考试申请书.pdf
- 瓦楞纸箱展开图.pdf
- 电子工程专业就业前景分析.pdf
- 留学申请-工科硕士PS范文.pdf
- 白鳝Oracle数据库性能优化实务课程视频+源码.pdf
- 盘锦刘广成.ppt
- 计算机工程与科学-201309面向移动平台的消息通讯服务设计与实现.pdf
- 计算机工程与科学-201401-ARM平台基于改进视觉密码认证系统的设计与实现.pdf
- 计算机工程与设计-201311-安卓手机与数据库交互系统的设计与实现.pdf
- 计算机工程与设计-2014-分布式铁路车辆分布组件的设计与实现.pdf
- 计算机工程与设计-201401-基于Hadoop的电子商务推荐系统的设计与实现.pdf
- 计算机工程与设计-201401-基于WebGIS的气象信息服务系统的设计与实现.pdf
- 计算机工程与设计-201403-自适应的分布式文件系统元数据管理模型.pdf
- 计算机工程与设计-201403-轻量级动态工作流引擎的设计与实现.pdf
- 计算机应用与软件 -201310-海洋信息管理系统的设计与实现.pdf
- 计算机应用与软件 -201311-公交信息服务系统设计与实现.pdf
原创力文档


文档评论(0)