AIOps智能运维解决方案 .pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

AIOps智能运维解决方案

汇报人

xx年xx月xx日

1概述

1.1现状分析

早期的运维工作大部分是通过人力完成的,随着公司IT规模的增长及信息

化的进展,通过基础的运维系统将一些重复劳动的效率进行提高,为系统的管理、

监测和稳定运行保障做出了重要贡献。

目前,公司现有的传统“稳态”IT环境的运维主要围绕监测、处理、展现

三个主要活动来展开,也就是常说的“监、管、控”,体现的”眼“和”手“作

用。尤侧重于监测,强调对IT环境的运行监测的准确、及时和全面,最大的感

知和体现是多种方式的告警或预警通知。在时间层面,它更多的是”事后型“,

即在事件发生后展开一系列的运维活动;在处理的方式上,依赖于过往经验,以

及”骨干“或”专家“的梳理与提炼,形成固化的规则或知识来指导运维;

而随着公司信息系统边界持续延伸,通信网络边界加速扩展,信息运维对象

的规模和复杂度越来越高,重要系统一二级部署等信息化建设持续推进,信息运

维对象在集中度上发生显著变化,同时云计算、大数据、物联网、移动信息化等

新技术的大规模应用对公司信息通信敏捷服务、快速部署和安全稳定运行提出更

高要求。

现阶段,公司运维管理系统在管理效率、运维精益、作业手段、服务成效等

方面还存在一些不足和差距。比如,公司信息运维管理系统,可以对事先定义标

签的故障进行发现和报告,可对事先定义标签的故障进行发现和报告,但对没有

标签的未知故障,则需要很长的人工排除时间。

1.2建设目标

以大数据、机器学习等人工智能技术为基础,构建AIOps智能运维系统,通

过AI算法承担起分析海量运维数据的重任,构建信息化系统运维中无标签未知

故障发现的能力,能够自动、准确地发现和定位问题。

系统基于对“敏态”IT环境的需求,注重对于运维事件的预测、分析和决

策,强调对运维全过程的贯穿,提供具备主动性、人性化及动态可视化的能力,

直接或间接地提升目前传统IT运维(监控、自动化、服务台)的能力,为企业

运营和运维工作在成本、质量和效率方面的优化提供重要支持。

1.3必要性分析

现有运维系统,大量运维决策严重依赖人员经验,即通过PE角色线上解决

运维问题。但此类专家经验非系统能力,人员数量有限,不具备规模化复制能力。

而基于经验沉淀下的规则系统,不具备泛化能力,系统很难对稍微不一样的输入

做出正确性的判断。

随着公司业务规模扩大,公司IT架构复杂性呈现指数级增长,运维人员需

要做到7*24小时的职守来保证系统的可靠性和稳定性,同时,规模效应和时间

维度上的积累会导致运维数据(日志、监控数据、应用信息等)体量异常庞大,

传统基于经验规则方式的运维对支撑公司不断扩展的业务发展面临严峻的挑战。

2解决方案

2.1整体方案

以大数据、机器学习等人工智能技术为基础,构建AIOps智能运维系统,

AIOps智能运维系统通过对信息系统中日志数据、网络数据、指标数据、应用数

据等各类数据进行接入分析,再通过数据治理进行数据清洗和数据模型搭建、应

用机器学习输出产生运维细分算法模型,进行分析计算,将相应的分析结果输出

返回给原运维管理系统进行展现和告警。AI算法承担分析海量运维数据,实现

自动、准确地发现和定位运维故障问题。

AIOps运维实施包含如下要素:

数据源:大量并且种类繁多的IT基础设施;

数据平台:用于处理历史和实时的数据;

计算与分析:通过已有的IT数据产生新的数据,例如数据清洗、去除噪声

等;

算法:用于计算和分析,以产生IT运维场景所需要的结果;

机器学习:主要包括无监督学习,可根据基于算法的分析结果来产生新的算

法;

2.2具体实施方案

2.2.1数据采集

数据采集负责将智能运维所需要的数据接入至AIOps平台,所接入的运维

数据类型一般包括(但不限于)日志数据,性能指标数据,网络抓包数据,用户行

为数据,告警数据,配置管理数据,运维流程类数据等。

2.2.2数据处理

针对采集数据进行入库前的预处理,数据从非结构化到结构化的解析,数据

清洗,格式转换

文档评论(0)

. + 关注
官方认证
文档贡献者

专注于职业教育考试,学历提升。

版权声明书
用户编号:8032132030000054
认证主体社旗县清显文具店
IP属地河南
统一社会信用代码/组织机构代码
92411327MA45REK87Q

1亿VIP精品文档

相关文档