【专家观点】刘晓辉:运维平台可观测与数字孪生的落地实践.docx

【专家观点】刘晓辉:运维平台可观测与数字孪生的落地实践.docx

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

运维平台可观测与数字孪生的落地实践

刘晓辉

运维开发团队负责人

01关于应用运维的问题与思考

目录

02可观测监控

03数字孪生

04未来展望

GO

GOPS全球运维大会暨XOps技术创新峰会2024·北京站

01关于应用运维的问题与思考

GOPS全球运维大会暨XOps技术创新峰会2024·北京站

运维痛点

系统复杂度高需要支持主机,

系统复杂度高

需要支持主机,

SOA,微服务等多元环境

需要展示的数据种类多

需要采集的数据对象多

安全要求高担负民航运行生命线

安全要求高

担负民航运行生命线生产安全责任重

用户群体多元且权限划分细致

数据质量参差不齐

软件多,交易链路

复杂自动化要求高

复杂

降本增效

需要及时精确的数据获取

需要快速精准的故

障处置

GO

GOPS全球运维大会暨XOps技术创新峰会2024·北京站

应用运维的主要工作

运维工作与应用场景

监控规则设置监控工具优化

应急演练

系统应急恢复数据补偿

运维需求分析运维工具开发

监控报警应用变更

例行维护应急处置

问题排查处理

容量规划

运维设计开发

变更准备变更实施结果检查

故障原因排查容量评估

系统实施

运维反馈改进运维知识输出

GO

GOPS全球运维大会暨XOps技术创新峰会2024·北京站

运维平台建设路径

平台化(Platformization)特征指标:平台化率手工化(

平台化(Platformization)特征指标:平台化率

建立统一的运维平台来

集中管理运维任务,实现部分流程的标准化和

集中管理运维任务,实现部分流程的标准化和规范化。

执行,包括监控、配置、

故障排查

自动化(Automation)特征指标:工具化率利用脚本、工具和自动

自动化(Automation)特征指标:工具化率

利用脚本、工具和自动化软件来执行重复性的运维任务,减少人工干预。

应用人工智能、机器学习等技术,使运维平台能够自我优化、预测故障和自动解决问题

GO

GOPS全球运维大会暨XOps技术创新峰会2024·北京站

运维平台整体架构方案

GO

GOPS全球运维大会暨XOps技术创新峰会2024·北京站

运维平台整体架构方案

GO

GOPS全球运维大会暨XOps技术创新峰会2024·北京站

02可观测监控

GOPS全球运维大会暨XOps技术创新峰会2024·北京站

监控整体架构方案

GO

GOPS全球运维大会暨XOps技术创新峰会2024·北京站

监控三要素的能力对可观测能力的支持-日志和指标

日志

指标

集中存储搜索与分析

仪表盘趋势分析

GO

GOPS全球运维大会暨XOps技术创新峰会2024·北京站

基于审计日志的调用链路分析

审计日志是开发规范中必须要打印的日志,在程序入口和出口分别打印,包括唯一ID,进出目的,错误响应,系统耗时等内容

?全局唯一的GlobalID

?控制头?扩展区?内容区

处理架构

GO

GOPS全球运维大会暨XOps技术创新

文档评论(0)

186****0576 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5013000222000100

1亿VIP精品文档

相关文档