- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
AIOps智能运维解决方案
汇报人
xx年xx月xx日
1概述
1.1现状分析
早期的运维工作大部分是通过人力完成的,随着公司IT规模的增长及信息
化的进展,通过基础的运维系统将一些重复劳动的效率进行提高,为系统的管理、
监测和稳定运行保障做出了重要贡献。
目前,公司现有的传统“稳态”IT环境的运维主要围绕监测、处理、展现
三个主要活动来展开,也就是常说的“监、管、控”,体现的”眼“和”手“作
用。尤侧重于监测,强调对IT环境的运行监测的准确、及时和全面,最大的感
知和体现是多种方式的告警或预警通知。在时间层面,它更多的是”事后型“,
即在事件发生后展开一系列的运维活动;在处理的方式上,依赖于过往经验,以
及”骨干“或”专家“的梳理与提炼,形成固化的规则或知识来指导运维;
而随着公司信息系统边界持续延伸,通信网络边界加速扩展,信息运维对象
的规模和复杂度越来越高,重要系统一二级部署等信息化建设持续推进,信息运
维对象在集中度上发生显著变化,同时云计算、大数据、物联网、移动信息化等
新技术的大规模应用对公司信息通信敏捷服务、快速部署和安全稳定运行提出更
高要求。
现阶段,公司运维管理系统在管理效率、运维精益、作业手段、服务成效等
方面还存在一些不足和差距。比如,公司信息运维管理系统,可以对事先定义标
签的故障进行发现和报告,可对事先定义标签的故障进行发现和报告,但对没有
标签的未知故障,则需要很长的人工排除时间。
1.2建设目标
以大数据、机器学习等人工智能技术为基础,构建AIOps智能运维系统,通
过AI算法承担起分析海量运维数据的重任,构建信息化系统运维中无标签未知
故障发现的能力,能够自动、准确地发现和定位问题。
系统基于对“敏态”IT环境的需求,注重对于运维事件的预测、分析和决
策,强调对运维全过程的贯穿,提供具备主动性、人性化及动态可视化的能力,
直接或间接地提升目前传统IT运维(监控、自动化、服务台)的能力,为企业
运营和运维工作在成本、质量和效率方面的优化提供重要支持。
1.3必要性分析
现有运维系统,大量运维决策严重依赖人员经验,即通过PE角色线上解决
运维问题。但此类专家经验非系统能力,人员数量有限,不具备规模化复制能力。
而基于经验沉淀下的规则系统,不具备泛化能力,系统很难对稍微不一样的输入
做出正确性的判断。
随着公司业务规模扩大,公司IT架构复杂性呈现指数级增长,运维人员需
要做到7*24小时的职守来保证系统的可靠性和稳定性,同时,规模效应和时间
维度上的积累会导致运维数据(日志、监控数据、应用信息等)体量异常庞大,
传统基于经验规则方式的运维对支撑公司不断扩展的业务发展面临严峻的挑战。
2解决方案
2.1整体方案
以大数据、机器学习等人工智能技术为基础,构建AIOps智能运维系统,
AIOps智能运维系统通过对信息系统中日志数据、网络数据、指标数据、应用数
据等各类数据进行接入分析,再通过数据治理进行数据清洗和数据模型搭建、应
用机器学习输出产生运维细分算法模型,进行分析计算,将相应的分析结果输出
返回给原运维管理系统进行展现和告警。AI算法承担分析海量运维数据,实现
自动、准确地发现和定位运维故障问题。
AIOps运维实施包含如下要素:
数据源:大量并且种类繁多的IT基础设施;
数据平台:用于处理历史和实时的数据;
计算与分析:通过已有的IT数据产生新的数据,例如数据清洗、去除噪声
等;
算法:用于计算和分析,以产生IT运维场景所需要的结果;
机器学习:主要包括无监督学习,可根据基于算法的分析结果来产生新的算
法;
2.2具体实施方案
2.2.1数据采集
数据采集负责将智能运维所需要的数据接入至AIOps平台,所接入的运维
数据类型一般包括(但不限于)日志数据,性能指标数据,网络抓包数据,用户行
为数据,告警数据,配置管理数据,运维流程类数据等。
2.2.2数据处理
针对采集数据进行入库前的预处理,数据从非结构化到结构化的解析,数据
清洗,格式转换
您可能关注的文档
最近下载
- 2025年文山州砚山县中医医院第十一期招聘(18人)笔试备考题库及答案解析.docx VIP
- C186015【基础】2025年海南医学院105300公共卫生《353卫生综合之医学统计学》考研基础.pdf VIP
- 2025年湖南有色金属职业技术学院单招职业技能测试题库及一套答案.docx
- 中国乙型肝炎病毒母婴传播防治指南(2024年版)解读.pptx
- 有机磷农药中毒.ppt VIP
- 骨科手术护理培训.pptx VIP
- 2025退役分类考试题及答案.docx VIP
- 护线宣传方案课件.pptx VIP
- 2025年文山州砚山县中医医院第十一期招聘(18人)笔试备考试题及答案解析.docx VIP
- SL 557-2012水利基本建设项目竣工决算审计规程.pdf
文档评论(0)