网站大量收购独家精品文档,联系QQ:2885784924

曹家豪:稳定性保障工具落地实践.pdf

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

中联通数字化监控平台稳定性

保障工具落地实践

曹家豪联通软件研究院项目经理

1稳定性保障工具演进历程

目录

2稳定性保障工具落地场景

CONTENTS及成效

3当前面临的挑战及未来展望

01稳定性保障工具演进历程

数字化转型中系统安全生产痛点问题

随着云原生技术的不断成熟,企业数字化转型也在不断加速,企业IT架构进入云原生时代,多云多集群部署已

经成为常态和趋势,几何增长的云资源、微服务以及复杂化的调用关系与业务场景,传统人肉运维难以为继,

如何保障系统的全面稳定,保证业务流程的高效运转,为系统运营提出了不小的挑战。

工具职责范围的演进:覆盖广度及深度不断增加

几个集团+省分

心系统几百套系统

分布式架构挑战运维生态挑战故障发现

与诊断

单系统跨系统全链路

维护对象:系统节点、微服务数量几何级数增加工具重复:工具按烟囱式建设,能力分散应用维度因定位定界诊断

调用关系:从简单对应到极其复杂,人力维护无法胜任能力割裂:运维工具能力割裂不成体系

数据分片、异地存储,传统维护模式难以为继数据孤岛:应用、数据库、中间件、云平台、

故障点人工恢复故障自愈

基础设施各管自身

故障恢复

与应急

系统具备应急预案混沌工程

被动应急主动预防

故障预防

变更追踪

文档评论(0)

如此醉 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档