网站大量收购闲置独家精品文档,联系QQ:2885784924

(5)IT运维管理:ITIL先锋论坛—平安科技AIOPS建设实践分享.docx

(5)IT运维管理:ITIL先锋论坛—平安科技AIOPS建设实践分享.docx

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

XX科技AIOPS建设实践分享

GOP

GOPS全球运维大会2020·深圳站

1平安科技AIOPS体系

CONTENTS目录

CONTENTS

目录

2智能检测建设

3智能定位探索

4思考与展望

GOP

GOPS全球运维大会2020·深圳站

01XXAIOPS体系

01

基于运维大数据分场景实现,模型结果回流工作流程形成闭环,整体提升运维能力

GOP

GOPS全球运维大会2020·深圳站

XXAIOPS体系-概览

平安AIOPS:三大智能场景

知决行

智能检测智能定位智能预测

运维数据中台

會會运维基础数据

配置数据监控

配置数据

告警信息变更

告警信息

目标l准确告警传统的静态阈值或同环比等算法策略无法动态适应指标正常的趋势变化,易产生误报;

目标

l准确告警

传统的静态阈值或同环比等算法策略无法动态适应指标正常的趋势变化,易产生误报;AI模型能够自适应指标趋势,准确发现异常的指标变动。

l及时恢复

AI模型通过训练学习,集成专家预警故障、诊断定位故障的知识,智能快速的发现故障,并定位根因点辅助快恢复。

l主动预防

运用机器学习、深度学习等算法模型,探索发现故障发生前的趋势变化规律,智能预警故障可能发生,提前介入、主动预防,避免故障发生。

GOP

GOPS全球运维大会2020·深圳站

XXAIOPS体系-架构

基于运维数据中台,建立计算平台,实时将各场景计算结果返回统一的告警中心,形成应用到工作流程闭环。

智能检测

智能检测

实时计算告警中心智能定位离线

实时计算

告警中心

智能定位

离线建模

模型存储

计算平台

智能预测

智能预测

实时数据

实时

数据

运维大数据平台

运维大数据平台

运维数据历史数据

运维数据

历史数据

GOP

GOPS全球运维大会2020·深圳站

02智能检测建设

02

基于机器学习相关算法,运用有限样本结合泛化技术,实现海量指标的准确告警

GOP

GOPS全球运维大会2020·深圳站

智能检测建设-概览

分场景试点批量应用迭代训练模型异常特征建模

分场景试点

批量应用

迭代训练模型

异常特征建模

周期

周期特征

统计

统计特征

趋势

趋势特征

不同

不同业务

容量大小消耗高低不同

容量大小

消耗高低

不同领域

各类有代表性的业务,软硬件各个层次和

规模大小领域,各类代表性技术特征流量

规模大小

领域,各类代表性技术特征

流量大小

负载高低

吞吐高低

吞吐高低

人工标注反馈优化

123违反周期循环

123

违反周期循环

4

超出波动范围

背离历史趋势

应用指标业务指标主机指标网络指标存储指标数据库指标中间件指标

GOP

GOPS全球运维大会2020·深圳站

智能检测建设-建模

在资源有限、难以用海量标注训练出准确模型的条件下;我们首先总结典型异常特征曲线、提炼业务规则、选取适用算法建模,然后采用先无监督试算、后抽样标注,反馈训练优化的方法,在有限标注样本量下,建立起效果较好的模型。

No1:无规律性波动曲线

特征描述:无明显规律地波动,该曲线如突然掉0属于有问题。

No2:异常掉0型曲线

特征描述:正常情况下,该曲线不会再工作时间段掉到0值,异常情况发生数据掉

No3:不规律锯齿型曲线

特征描述:持续的锯齿数据,但是在异常情况下,锯齿的齿头和齿尾都向上/下仰。

No4:突增型波动曲线

特征描述:正常情况有固定的活动范围,突然使用飙高,存在生产故障风险.

No5:规律性波峰曲线(突降)

特征描述:正常状态下,该曲线遵循一定规律波动,如有大幅度突降属于故障。

No6:上下串动型曲线

特征描述:数据在两个值之间上下串动,无明显串动规律。

No7:无规律类型曲线

特征描述:无规律性的展示曲线,正常状态下一直在小范围上下波动,异常状态会偶发突起。

No8:突增型曲线

No9:规律性波峰曲线(掉0)

特征描述:正常情况为0,有异常的情况下会突然增长上升。

特征描述:规律性的业务曲线,如有突然波动,即属于异常状态。

无监督学习

统计算法

时序算法

深度学习

GOP

GOPS全球运维大会2020·深圳站

智能检测建设-训练泛化

基于历史训练学习、动态发现特征,实现对海量新指标的泛化应用,达到有限样本下支撑海量指标的检测应用仍保持较好的准召率。

动态特征学习自

文档评论(0)

ITIL先锋论坛 + 关注
实名认证
内容提供者

ITIL先锋论坛

1亿VIP精品文档

相关文档