- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
XX科技AIOPS建设实践分享
GOP
GOPS全球运维大会2020·深圳站
1平安科技AIOPS体系
CONTENTS目录
CONTENTS
目录
2智能检测建设
3智能定位探索
4思考与展望
GOP
GOPS全球运维大会2020·深圳站
01XXAIOPS体系
01
基于运维大数据分场景实现,模型结果回流工作流程形成闭环,整体提升运维能力
GOP
GOPS全球运维大会2020·深圳站
XXAIOPS体系-概览
平安AIOPS:三大智能场景
知决行
知
决
智能检测智能定位智能预测
运维数据中台
會會运维基础数据
配置数据监控
配置数据
告警信息变更
告警信息
…
目标l准确告警传统的静态阈值或同环比等算法策略无法动态适应指标正常的趋势变化,易产生误报;
目标
l准确告警
传统的静态阈值或同环比等算法策略无法动态适应指标正常的趋势变化,易产生误报;AI模型能够自适应指标趋势,准确发现异常的指标变动。
l及时恢复
AI模型通过训练学习,集成专家预警故障、诊断定位故障的知识,智能快速的发现故障,并定位根因点辅助快恢复。
l主动预防
运用机器学习、深度学习等算法模型,探索发现故障发生前的趋势变化规律,智能预警故障可能发生,提前介入、主动预防,避免故障发生。
GOP
GOPS全球运维大会2020·深圳站
XXAIOPS体系-架构
基于运维数据中台,建立计算平台,实时将各场景计算结果返回统一的告警中心,形成应用到工作流程闭环。
智能检测
智能检测
实时计算告警中心智能定位离线
实时计算
告警中心
智能定位
离线建模
模型存储
计算平台
智能预测
智能预测
实时数据
实时
数据
流
运维大数据平台
运维大数据平台
运维数据历史数据
运维数据
历史数据
GOP
GOPS全球运维大会2020·深圳站
02智能检测建设
02
基于机器学习相关算法,运用有限样本结合泛化技术,实现海量指标的准确告警
GOP
GOPS全球运维大会2020·深圳站
智能检测建设-概览
分场景试点批量应用迭代训练模型异常特征建模
分场景试点
批量应用
迭代训练模型
异常特征建模
周期
周期特征
统计
统计特征
趋势
趋势特征
不同
不同业务
容量大小消耗高低不同
容量大小
消耗高低
不同领域
各类有代表性的业务,软硬件各个层次和
规模大小领域,各类代表性技术特征流量
规模大小
领域,各类代表性技术特征
流量大小
负载高低
吞吐高低
吞吐高低
人工标注反馈优化
123违反周期循环
123
违反周期循环
4
超出波动范围
背离历史趋势
应用指标业务指标主机指标网络指标存储指标数据库指标中间件指标
GOP
GOPS全球运维大会2020·深圳站
智能检测建设-建模
在资源有限、难以用海量标注训练出准确模型的条件下;我们首先总结典型异常特征曲线、提炼业务规则、选取适用算法建模,然后采用先无监督试算、后抽样标注,反馈训练优化的方法,在有限标注样本量下,建立起效果较好的模型。
No1:无规律性波动曲线
特征描述:无明显规律地波动,该曲线如突然掉0属于有问题。
No2:异常掉0型曲线
特征描述:正常情况下,该曲线不会再工作时间段掉到0值,异常情况发生数据掉
No3:不规律锯齿型曲线
特征描述:持续的锯齿数据,但是在异常情况下,锯齿的齿头和齿尾都向上/下仰。
No4:突增型波动曲线
特征描述:正常情况有固定的活动范围,突然使用飙高,存在生产故障风险.
No5:规律性波峰曲线(突降)
特征描述:正常状态下,该曲线遵循一定规律波动,如有大幅度突降属于故障。
No6:上下串动型曲线
特征描述:数据在两个值之间上下串动,无明显串动规律。
No7:无规律类型曲线
特征描述:无规律性的展示曲线,正常状态下一直在小范围上下波动,异常状态会偶发突起。
No8:突增型曲线
No9:规律性波峰曲线(掉0)
特征描述:正常情况为0,有异常的情况下会突然增长上升。
特征描述:规律性的业务曲线,如有突然波动,即属于异常状态。
无监督学习
统计算法
时序算法
深度学习
GOP
GOPS全球运维大会2020·深圳站
智能检测建设-训练泛化
基于历史训练学习、动态发现特征,实现对海量新指标的泛化应用,达到有限样本下支撑海量指标的检测应用仍保持较好的准召率。
动态特征学习自
您可能关注的文档
- (1)IT运维管理:ITIL先锋论坛—AIOps在运维团队的实施.docx
- (2)IT运维管理:ITIL先锋论坛—DevOps来了运维如何改变.docx
- (3)IT运维管理:ITIL先锋论坛—IT运营智慧化实践方案.docx
- (4)IT运维管理:ITIL先锋论坛—某互联网公司运维平台技术方案.docx
- (6)IT运维管理:ITIL先锋论坛—事件管理为基础建立质量体系.docx
- (7)IT运维管理:ITIL先锋论坛—云计算对IT运维的影响.docx
- (8)IT运维管理:ITIL先锋论坛—云主机无人值守和自助服务案例.docx
- (9)IT运维管理:ITIL先锋论坛—智能运维的算法和场景.docx
- (10)IT运维管理:ITIL先锋论坛—智能运维的推进路线和最佳实践.docx
- 参观公司路线流程.pptx
最近下载
- 2023年南京信息工程大学计算机科学与技术专业《计算机网络》科目期末试卷B(有答案).docx VIP
- 2024华医网继续教育脑卒中的全面康复题库答案.docx VIP
- 2023年南京信息工程大学计算机科学与技术专业《计算机网络》科目期末试卷A(有答案).docx VIP
- 2024秋译林版英语六年级上册《学霸提优大试卷》(全册含答案).docx VIP
- 中国慢性冠脉综合征患者诊断及管理指南2024版解读.pptx
- (完整)混凝土回弹强度自动计算EXCEL表.xls VIP
- 2023-2024学年九年级上册历史期末考试论述题必刷20道(解析版).docx VIP
- 2.5 一元一次不等式与一次函数(1)教案-2022-2023学年北师大版八年级下册数学.docx VIP
- GB_T 43866-2024 企业能源计量器具配备率检查方法.pdf
- 四级听力必备词汇.ppt
文档评论(0)