- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大型企业智能运维探索与实践
孙 杰
目 录
1 构建一个全面科学的IT运维管理体系
2 全景业务服务管理
3 基于大数据平台的日志分析和多维报表
4 统一展现事件及监控告警平台
5 知识库及故障自治管理
IT部门面临的挑战
IT部门的整体认可不足 运维人员工作负荷大 ,工作
模式不被员工认可
• 运维有效性的业务衡量方法与工 • 基于基本的被动式响应处理模式,
具较少,业务层面很难体现运维改 没有客户自助服务,没有主动干预
进 服务,价值认可度低
依据业务需求调整服务和设
运行态势相关信息掌握不足
置资源的能力不足
• 运行态势相关指标不成体系,很
难作出决定 • 调整和设置所需的业务流程在大多
数客户处并不具备
• 确保运行态势保持合理水平的能
力不足 • 调整和设置所需的技术手段也在很
多客户处并不具备
实现 目标
全面的性能管理 统一的资源管理
提供对各种服务器设备、设备间 通过IT运维平台可以统一的把所有
直连链路、链路服务质量等性能指 的资产进行统一的管理、统一的分派
标进行实时监测并提供阈值告警。 等。
设备指标包括CPU、内存、环境指
标等 ;链路指标包括流入流出速率、
时延、抖动、丢包率和错包率等。
及时的故障告警管理
提供对多种网络故障和告警进行 统一集中展现管理
实时分析和告警的能力 ,网管人员 提供集中展现平台 ,对于各个分
可监视并处理各级网元的各级实时 中心进行统一的报表及业务的监控 ,
告警 ,对相关告警网元进行告警确 提供实时的监控数据和运维报表。
认、故障处理、告警清除等操作。
基础设施部署架构图
智能化统一平台技术架构图
核心问题 :
• 跨地域跨平台、支持异构的IT综合运维平台
• 深入监控并进行集中统一的可视化管理
• 有效预防问题的产生及快速定位故障,降低运维成本
• 采用丰富的多维度报表为用户决策提供数据支撑。
• 全局业务服务的视角、平台化扩展兼容 以及大数据融合
• 满足企业对业务的高效和快速迭代的需求,实现IT对业务的有效支撑
• 保护优化IT资产投资,实现IT资产价值的最大化
聚焦
• 规范化 • 可控性
规范化运行维护管 实现 IT 成本控制 ,
理
文档评论(0)