- 0
- 0
- 约1.26万字
- 约 11页
- 2023-05-05 发布于四川
- 举报
本发明提供一种运行维护大规模集群的方法、系统、设备和存储介质,方法包括:在管理节点部署管理模块和客户端模块,在计算节点部署客户端模块;所述管理模块从所述客户端模块获取所有管理节点和计算节点的各项监控数值,与当前配置的监控策略阈值进行比较;响应于满足报警条件,在管理节点生成报警数据,并根据所述报警数据进行任务处理策略匹配;以及响应于匹配成功,在管理节点生成故障处理任务,并基于客户端模块的主动拉取将所述故障处理任务传输到对应的客户端模块。本发明将作业执行压力由管理节点分担至各个计算节点;管理节点仅仅
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 114301759 A
(43)申请公布日 2022.04.08
(21)申请号 202111507568.9
(22)申请日 2021.12.10
(71)申请人 苏州浪潮智能科技有限公司
原创力文档

文档评论(0)