基于自主计算的集群管理软件的设计和实现.pptxVIP

  • 10
  • 0
  • 约8.54千字
  • 约 39页
  • 2021-08-14 发布于上海
  • 举报

基于自主计算的集群管理软件的设计和实现.pptx

基于自主计算的集群管理软件的设计和实现第1页/共39页概述课题来源北航校园网格建设中对集群计算环境的管理需求十一五863计划信息技术领域重大项目:高效能计算机系统研制及关键技术研究 2007AA01A127 研究背景集群占据了我国高性能产品和应用的90%份额集群管理日趋复杂北航校园网格目前采用ganglia集群监测软件,无法满足需求平均故障恢复时间较长自主计算研究计算系统的自管理问题,为集群系统管理提供了一种新的思路第2页/共39页自主计算IBM于2001年提出自主计算的概念思想起源于人体的植物神经系统其动机是试图通过“技术管理技术” 自主计算系统具有的属性自动修复自动优化自我保护自动配置第3页/共39页集群管理的国内外相关研究Ganglia树状分层式结构,可扩展没有解决非叶子节点层的容错,易造成单点故障Supermon基于linux集群的分布式监控不能动态添加节点Hawkeye可以定制资源监测模块,适用多平台系统客户端工具还不完善国内曙光公司的DCMM集群监控系统面向曙光服务器集群,软硬件结合研究现状:1、国外起步较早,国内相对滞后2、大多侧重集群的监测3、缺乏自主管理能力第4页/共39页报告内容概述主要内容ACMS体系结构和功能模块实现ACMS事件通知机制节点代理的自配置机制中间汇集节点的自恢复机制工作总结和展望第5页/共39页ACMS自主管理模型分析决策IBM自主计算框架没有

文档评论(0)

1亿VIP精品文档

相关文档