面向分布式转型的异构系统运维管理平台建设.docxVIP

面向分布式转型的异构系统运维管理平台建设.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

近年来,面对国际形势变化以及互联网企业架构带来的启发,商业银行纷纷开启分布式转型,同时其信息系统架构也呈现出集中式与分布式并存的特点。在此趋势下,IT运维团队不仅要继续承担传统集中式大型主机平台平稳运行的运维职责,又要做好未来分布式运维的技术储备,尤其在大型主机技术相对封闭、向分布式技术栈迁移难度较大的情况下,如何顺利实现运维技术转型成为当前面临的重大挑战。与此同时,在集中式和分布式并存的复杂架构下,只有让运维能力具备与运维对象松耦合的可迁移性和普适性,才能更好地适应银行信息系统技术不断更迭的现状和趋势。

针对上述变化,笔者团队以多年积累的运维经验为基础,总结提炼了分布式运维管理方法论,并配套搭建异构系统运维管理平台,创新开展了以数据统一采集与标准化治理为基础支撑、以标准化产品组件为控制接口、以即插即用的工具平台为共享服务、以运维需求为应用场景的落地实践,逐步推动运维模式从“事件驱动”向“数据驱动”转变,推动平台建设从“需求功能实现”向“通用运维能力沉淀”转变。

一、异构系统运维管理平台

架构设计

面向分布式转型趋势,笔者团队将新技术手段与管理流程优化相融合,着力推动以数据驱动的智能运维体系建设,并创新搭建了异构系统运维管理平台(如图1所示)。该平台基于多维度运维数据,在屏蔽底层运维对象复杂性的基础上,重点实现了标准化数据治理与规范化接口调用,旨在迭代推动运维模式向可视化、自动化和智能化转型。平台设计重点强调了三项基本原则:一是相对独立,即将复杂的运维能力建设拆分为相对独立的服务建设,通过规范接口,实现平台间、模块间的相互调用协作;二是能力复用,即使每一个开发过的功能模块在之后的能力建设中能够被最大程度被复用,进而降低成本、缩短时间,实现乘数效应;三是闭环设计,即通过将人的能力和机器的能力统筹考虑,最终实现数据、分析、决策、处置的操作闭环与事前、事中、事后的流程闭环,并借此持续推进自动化、智能化转型。

图1异构系统运维管理平台架构设计

基于上述原则,异构系统运维管理平台重点打造数据治理、控制接口、共享服务、应用场景等四大功能模块,并在其中内嵌了“数据驱动、预防为主、应急为辅”的预防性维护闭环流程。其中,数据治理功能重在实现对异构运维对象数据的统一采集、存储、归总,控制接口功能重在实现对异构运维对象的统一控制操作,共享服务功能重在将常用的数据分析服务集成为通用工具,应用场景则是指根据事前、事中、事后的应急闭环迭代流程落地具体的运维场景,并以统一门户全景展示异构运维对象的实时状态。

1.数据治理模块

异构系统运维管理平台的运维对象涉及大型主机平台、AIX平台、X86平台等多个并存的异构系统,每天有大量源数据存储需求,数据的类型、格式也千差万别。对此,笔者团队首先在数据治理模块中搭载了数据字典,并据此标准化数据采集工具,最后基于数据仓库统一存储的治理策略,搭建了主机性能容量平台(TDS)、大数据平台(BIGDATA)、配置管理数据库(CMDB)三大平台作为数据治理的主要抓手,建设标准化的平台数据资源池。

以主机性能容量平台为例,该平台重点实现了对主机性能指标(SMF)数据的统一结构化存储与管理。实践中,TDS首先是按照系统、存储、数据库、交易中间件、消息中间件、批量等组件划分方式,分条目建设性能指标体系,再基于指标体系抽取了685个常见的性能指标作为采集对象,每一类组件设计有单独的采集解析脚本,收集数据互不影响,且采集的数据会统一落入DB2和MySQL数据库。

在此基础上,作为支持上层应用的数据资源,该平台还重点搭载了三个典型应用:第一部分是系统的健康检查,帮助运维人员快速掌握系统运行状态,发现潜在的性能问题;第二部分是关键指标的容量预估,通过分析指标的长期变化趋势,提前预估基础环境中的容量问题,做好容量规划,保障生产资源的弹性扩容;第三部分是事后问题诊断,通过对底层多维度的指标关联挖掘,平台集成有波动分析、趋势分析、对比分析等多个分析模型,用于根因的快速分析定位。

2.控制接口模块

为实现对异构平台的统一自动化调用,控制接口模块中搭载了中国银行自主研发的自动化运维管理平台——MOMA。MOMA通过将常见运维操作进行标准化打包,可实现对异构运维对象的统一控制,并基于工作流编排、调度和交互控制等功能,支持用户在网页端定义一系列相互关联的指令作业,并按照事先约定的执行流程进行自动执行与实时追踪,从而实现一套流程、集中控制、重复使用,显著降低了管理成本和差错率。

MOMA平台通过标准化接口实现主机平台和开源平台对接,彻底改变了主机平台的闭源特性,使传统主机平台拥有了丰富的可视化界面。同时,在变更任务的拆分过程中,通过开发大量能满足平台接口调用规范的主机平台作业流,全面覆盖了自动化控制、智能判断等功能,并共同组建了主机自动化运维脚本库。未

文档评论(0)

丹青 + 关注
实名认证
文档贡献者

锄禾日当午 汗滴禾下土

1亿VIP精品文档

相关文档