大型企业智能运维的探索和实践.pdf

大型企业智能运维探索与实践 目录 构建新IT运维 全景业务 日志采集 知识库 管理体系 服务管理 监控告警 故障自治 01 构建新IT运维管理体系 传统运维软件逐渐不适应运维需求 2 4 单一 1 零散 针对不同的用户提供的是 5 一种软件监控一类设备,无法 相同的界面和视图,不能 提供整体的运维监控解决方案 满足用户不同岗位、不同 3 业务的运维要求 无用 事后 由于无法发挥实质性的作用 所有的运维软件大多是事后报 ,且运行时间长之后性能影 警,此时损失已经造成,晚了 响显著,最终被弃用。 ! “弱智” 智能化程度差,以监控和报表为主,不具 备大数据关联分析和深度数据挖掘功能 传统运维存在的突出问题 数据分散,不利于故障分析和问题跟踪 • 不同的数据存储在不同的运维系统中,无法关联 • 数据格式、时间戳等各不相同,不利于问题排查 要的功能没有,没用的数据重复采集,影响正常业务 • 每个运维软件都有特长部分,同时也采集其他数据,造成重复影响 • 有些甚至相互影响,干扰正常业务运行 投资浪费,增加运维压力 • 采购多种运维软件,在功能上、设备上存在投资浪费 • 没有减轻运维压力,还增加了多种软件的维护工作 运维技术在持续升级 数据 以设备为中心的维护 升级的3个原因: 技术进步 设备 升级为 运维事故 以数据为中心的运营 运维压力 运维的理想 运维应做到 无论云上云下,保障业务系统稳定运行都是最重要的工作。 • 通过部署智能运维系统,能够显著提升运维效率,大大增强运维团队的能力和价值; • 通过部署智能运维系统,能够显著增加运维透明度,使管理和运维人员增加主动权和掌控力; • 通过部署智能运维系统,能够显著降低故障频率,使运维更省心。 “活着” - 健康 维护 -运营 将运维质量的标准 ,从保证系统 “活着” ,升级为 帮助用户将以设备为中心的维护

文档评论(0)

1亿VIP精品文档

相关文档