AIOps关键四要素与趋势解读.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
AIOps关键四要素与趋势解读【导读】AIOps为什么是“人机协同”的模式,而不是智能化的模 式?为了更好地落地AIOps,运维组织需要如何理解AIOps的内涵?本文作 者对于AIOps运维的核心观点值得参考。 【作者】彭华盛,腾讯TVP, 10年+的金融领域运维工作,期间负责参与运维 组织、流程、工具建设,包括重大业务系统与数据中心工程性项目实施,标 准化工作流程构建,平台工具体系的规划与研发、数字化转型研究与实施相 关等,对金融领域的运维有较全面理解,更多信息见个人公众号“运维之路”AIOps是运维的方向,但AIOps不能单纯的认为一种技术手段或技术平台,而 应该是数智时代人机协同的运维模式。 1.人机协同的AIOps运维工作模式一种新的工作模式出现,必然会对原来稳定的工作模式进行改变,改变通常会 受到新挑战,所以新工作模式需要能解决当前运维工作中遇到的难题而出现。 以金融行业的业务连续性管理为例,目标是提高公司的风险防范能力、有效地 减少非计划的业务中断、防范运维操作风险,对于首次出现的未知异常能够利 用工具量化分析并快速定位,确保在重大灾难性事件发生后能按计划恢复业务 连续性是传统。在面对当前复杂的技术架构、不断引入的创新技术、快速迭代 的软件版本、严峻的信息安全威胁下,传统运维团队原来被动救火式、问题驱 动式、操作运维、经验运维已经很难实现企业业务连续性的保障目标。金融企 业运行安全稳定,需要运维数据赋予数据洞察、辅助决策、跟踪执行的能力, 提升复杂环境下的运维管理能力,即: 实时获得“发生了什么?” .关联分析“为什么会发生? ” 智能预测“将会发生什么? ” .决策判断“采取什么措施? ” 自动执行“如何快速执行?” 实时感知“工作执行的效果? ”AIOps就是为了解决上述问题而生,相比传统的运维工作模式,AIOps重点不是 创造一种全新的运维工作模式,而是对现有“专家经验+最佳实践流程+工具平 台”运维模式的补充,为企业运维工作提供“洞察感知、运营决策、机器执 行”能力,支持向“人机协同”模式转变。 为什么是“人机协同”的模式,而不是智能化的模式呢?因为从当前AIOps的 应用情况看,虽然人工智能技术领先,但当面对复杂、多变、信息不完全的环 境,特别是应用于需要复杂应急保障场景时,仍不具备替代专家,更多的应用 在某些特定弱人工智能领域。“人机协同”聚焦在通过机器辅助人的决策与执 行,是在原来运维组织内部参与者,以及运维以外的研发、测试、厂商等协同 网络上,增加机器人角色,形成人机协同的运维模式。人机协同的运维模式, 最关键的角色仍是人,利用人的创造力,结合机器所提供的数据和算法,辅助 人进行运维工作开展。总的来说,人机协同需要发挥人与机器人特长,形成一 个融合的解决方案,后续AIOps的重点推进方向可以围绕三点: “数据+算法”为运维专家赋能“实时感知、辅助决策”的能力。 增加运维机器人岗位,重塑“大计算”、“海量数据分析”、“操作 性”、“流程化”、“规律性” 、“7*24”、“人机体验”等类型的 运维工作。 建立数字平台化管理模式,闭环落实决策执行。 .数据、算法、场景、知识组成AIOps关键4要素如Gartner定义中提出,AIOps应用需要利用大数 据,现代机器学习技术和 其他 高级分析技术,是一种相对较高门槛的工作模式。为了更好地落地 AIOps,运维组织需要深刻的理解AIOps的内涵,重点实现思路:以数据为基 础、算法为支撑、场景为导向,知识为扩展的AI0ps4要素。 数据为先,AIOps需要快速生产高质量数据的能力。“快速”的思路可以以 “中台”思路进行建设,建立统一的数据采控、实时与批量的数据处理能力、与运维相匹配的运维算法、存储方案、主数据、指标模型等;“高质量”则从 将分散数据统一、在线后形成“活数据”,以及数据质量上的治理。从技术实 现看,具备实时“采、存、算、管、用”的数据流动全生命周期管理的能力。 其中,数据采集是按需在线采集数据的能力;数据存储是根据数据类型、数据 应用特点对数据进行归档、整理、传输、共享;数据计算包括数据标注、清 洗、建模、加工、标准化、质量监控,以及为了获得数据洞察、决策、执行而 对数据进行分析统计;数据管理重点围绕数据治理的,包括运维数据标准、主 数据、元数据、数据质量、数据安全的管理;数据使用重点围绕数据服务角度 涉及的数据目录、服务门户,以及配套的数据服务化能力。 算法大脑,适配、引入特定场景下运维算法,构建算法模型体系。机器学习尤 其是深度学习的大规模应用,推动了人工智能的快速发展。随着国内TOB市场 的火爆,AIOps上人工智能研究及应用正处于爆发期,引入AI技术的算法有三 点优势:一是工作稳定性高,人工智能可不知疲倦地进行工作,在规律性问题 的分析时不

文档评论(0)

183****7083 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档