张雁丽-脱敏-OnCall 驱动下的IT系统稳定性运营实践-脱敏版.pdf

张雁丽-脱敏-OnCall 驱动下的IT系统稳定性运营实践-脱敏版.pdf

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

OnCall驱动下的IT系统稳定性

运营实践

张雁丽

北京移动SRE执行小组产品经理、系统运维

姓名:张雁丽

SRE执行小组产品经理、系统运维

公司职位

主要负责SLO、可观测、运维保障及故障调度产品的设计与

研发。

GOPS全球运维大会暨XOps技术创新峰会2024·北京站

实施背景

整体框架与机制

目录运维保障

事件调度

工具支撑

经验分享与探索

GOPS全球运维大会暨XOps技术创新峰会2024·北京站

01实施背景

GOPS全球运维大会暨XOps技术创新峰会2024·北京站

运维保障及故障调度工作现状

运维保障、故障调度现状存在问题

p保障覆盖程度低

p仅具备变更保障

运维p保障未分类分级管理

运维p保障要求不明确保障

保障p无统一的保障标准

p保障依赖人员控制,效率低下,

p缺少好用的保障工具

保障效果无法保证

p无整体故障调度

p仅SaaS运维进行故障调度

p无标准响应流程

故障

p故障时,无标准流程,人员手忙脚乱

故障调度p缺少好用的故障调度工具

调度p无升级、对外信息发布机制

p管理缺失

p人员无法实时获取故障处理进展

GOPS全球运维大会暨XOps技术创新峰会2024·北京站

运维痛点

运维孤

文档评论(0)

150****8957 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档