银行业AIOps应用现状研究_大模型与自动化运维.docx

银行业AIOps应用现状研究_大模型与自动化运维.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

银行业AIOps应用现状研究_大模型与自动化运维

运维工程师应该深有体会——运维越来越难做,被海量高速的运维监控数据所淹没。AIOps的引入有其重要性和必要性。本文对银行业AIOps应用的真实现状进行了研究和分析,对于正在考虑或已经进行相关建设的同行具有参考价值。

1、背景

随着业务创新以及分布式架构、微服务、大数据、人工智能等技术演进,使得银行业IT运维面临软硬件数量激增、应用和架构复杂化、变更频繁、调用链显著增长、运维数据井喷等困难和挑战。

运维技术在各行各业的重要性越来越高,特别在商业银行使用更广、更深,由于商业银行数字化程度越来越高、系统规模越来越大、组件监控粒度越来越细、监控数据量越来越大以及新技术和新组件的不断引入,这些导致运维越来越难做,运维工程师也被海量高速的运维监控数据所淹没。

2、为什么需要AIOps?

AIOps是基于海量数据的采集与治理(数据化)、AI算法的深度应用(智能化)和端到端的自动化打造平台化的智能运维目标,实现全景监控与自动化、智能分析与决策、故障自愈与无人值守。AIOps的优势是有利于知识和经验的积累。在智能运维体系中,运维人员在角色转变的同时也实现了技能提升,从最初的人工运维,到部分自动化+数据分析,实现数据驱动的IT运维,最终走向高度数据化、高度AI下的完全自动化+运维专家模式。

随着新质生产力的发展、数字化转型的持续推进,现代数字业务需要监控和管理的系统变得更加复杂、更加分散,需要AIOps工具来实现跨IT堆栈的持续洞察,同时这种洞察力变得越来越重要。随着商业银行数字化转型的加速,IT系统产生的运维数据量呈现爆炸式增长,传统的运维方式难以应对海量数据的处理和分析,需要AIOps利用人工智能技术对数据进行自动化分析和处理,提高运维效率;现代IT环境由云化、容器化、微服务等多种技术构成,系统复杂性大幅增加,AIOps通过智能算法和机器学习技术,能够更好地识别和管理这种复杂性;AIOps可以自动关联和分析来自不同来源的事件,快速定位故障原因,同时,通过对历史数据的学习,AIOps能够预测系统潜在的问题,实现主动预防;AIOps可以实现故障的自动化响应和处理,减少人工介入,缩短故障恢复时间(MTTR),提高系统的稳定性和可用性。总之,AIOps的引入对于应对当前IT运维挑战、提高运维质量和效率、降低成本以及支持商业银行的数字化战略具有重要性和必要性。

3、?同业AIOps建设情况调研

以下是针对根据已发信息,针对体量巨大的家大型银行AIOPS建设情况进行了信息整理,包括建设背景、平台建设、平台建设、应用场景以及运维生态等,详情如下:

某大银行1

智能运维建设情况

建设背景:2019年起,运营中心践行金融科技战略,以项目群的方式启动了智能运维体系建设,目前主要是在数据中心私有云平台重点投入建设,包括在创新处以及应用处两个部门进行推广。公有云平台目前正在规划智能运维的建设,以龙舟云运维智能化方向为主。

平台建设:建设数据平台及算法平台,加强数据采控及集中管理能力,夯实数字化底座。

场景建设:以运维数据为基础,实现指标异常检测、日志异常检测、精准告警等基础运维数据分析场景,同时结合业务实现业务健康监测、业务影响分析等综合场景,初步建成了具体感知力、控制力、决策力的企业级智能运维体系。

运维组件

运维组件平台化、集中采控、精细化自动运维场景。

运维数据

龙舟运维大数据平台

运维生态

搭平台、做场景,运维工具生态与运维生态并存。

某大银行2

智能运维建设情况

建设背景:建设全行统一的“运维数据分析平台”,形成容纳海量运维数据的运维数据集市,解决运维数据存储不集中、数据不规范等问题;构建全行运维数据统一分析平台,推进运维数据应用的深度和广度,实践智能监控、智能运维等AIOps分析场景,为信息系统建设战略提供决策依据,为该行信息化转型提供动力。

平台建设:建立统一的运维数据集市,集中采集运维数据入库,对数据模型统一管理,并进行数据的标准化治理。

应用分析场景建设:以运维数据为核心,打通一体化生产运维平台体系内的关联系统,如监控平台、操作平台、管理平台、统一门户和配置中心,建设智能分析应用场景,包括异常检测、性能分析、趋势分析、故障诊断以及系统画像等场景。

运维组件

已构建统一采控支撑其运维中台,尝试流计算实现监控性能瓶颈。加速丰富配置消费场景。

运维数据

已建立持续运维数据治理策略。

运维生态

2018年筹划运维服务一体化能力建设,建立运维场景应用生态,2019年10月由科技与产品管理局牵头启动一体化生产运维平台体系建设工程需求场景化,2020年全年上线了22个大运维场景通过场景建设,逐步实现“5分钟异常发现、10分钟故障定位、20分钟异常恢复”的目标。

某大银行3

智能运维建设情况

建设背景:从智能

文档评论(0)

steven + 关注
实名认证
内容提供者

系统集成项目管理工程师、AMAC基金从业资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年08月23日上传了系统集成项目管理工程师、AMAC基金从业资格证

1亿VIP精品文档

相关文档