如何基于开源软件自主开发自动化运维系统.docxVIP

如何基于开源软件自主开发自动化运维系统.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一、背景与痛点 随着我行业务的迅猛发展,金融科技引领的效果不断增强,业务系统数量不断 攀升,对应的软硬件基础架构也越来越庞大,各系统相应的运行与维护工作的 难度和复杂度也与日剧增,规范化、精细化运维得不到有效施展,越来越多的 运维痛点问题开始不断涌现,与此同时带来各种运维风险,影响业务连续性。 其痛点主要体现在以下六个方面: 1、 信息资源数据难管理、难使用、准确性低的痛点。 (1) 运用多张EXCEL表格维护儿千台服务器和100余个应用系统的软硬件 资源信息,信息无法共享和及时同步更新,数据错误率高,容易造成运维工作 误判。 (2) 为保证EXCEL表格数据准确性,需经常进行信息资产盘点,耗时耗力。 (3) 数据间的关联无法得到体现,数据用不活,更无法被信息系统利用。 2、 基础监控盲点多,覆盖面不全,信息系统故障得不到及时响应,告警信息 无法正确匹配软硬件资源而产生误告的痛点。 (1) 信息资产多,信息更新快,监控部署和清除跟不上变化,需经常查漏补 缺,未及时被监控的系统风险极大。 (2) 未被自动化运维系统管控的计算实例,无法自动釆集信息、批量查询、 操作和巡检等,需要人工梳理和发现。 (3) 未被监控和自动化运维的计算实例无法通过有效地手段告知运维人员。 3、 运维人员忙乱于繁杂的软硬件与运行环境的部署、安装、创建与配置,整 体运维效率低下,精细化水平不高。 (1)运维人员的大部分精力耗费在运维环境部署上,尤其体现在新系统上线 频度高,上线量和环境部署量大时,因时间不足,得不到更高运维价值的锻炼, 运维眼界和思路得不到开拓。 (2) 单个系统逐个手动部署、安装、创建和配置,容易遗漏、错配,或者配 置需保持一致的多台计算实例产生差异化。 (3) 监控、备份等运维服务得不到重视,运维人员在大量完成应用环境准备 后,无精力去部署监控和备份,造成系统上线后无有效监控的问题。 4、 存在直接运维操作风险,运维人员水平参差不齐,无法调动更多的运维人 力参与运维工作,释放更多操作员的主观能动性,团体运维的价值和力量体现 严重欠缺。 (1) 运维人员少,工作压力大,操作员多,但工作范畴相对单一,但介于运 维技术的专业性,无法将操作员更好融入运维团队。 (2) 人工巡检直接登陆系统,通过超级用户巡检,风险隐患极大,巡检人员 素质参差不齐,需要靠运维人员实时跟踪其巡检,耗费精力,其他事情搁置。 (3) 每次人工巡检的结果未归档和保留,更无法查询,造成运维巡检数据丢 失,得不到有效积累,更无法通过历史运维数据挖掘深层次信息。 5、 日常运维巡检过程可能因巡检误操作带来衍生风险,需巡检的软硬件设备 与日俱增,巡检效率低下,遗检漏检等现象严重。 (1) 巡检点多,类别多,涵盖面广,依靠人工单个巡检无法面面俱到。 (2) 人工巡检直接登陆系统,通过超级用户巡检,风险隐患极大,巡检人员 素质参差不齐,需要靠运维人员实时跟踪其巡检,耗费精力,其他事情搁置。 (3) 每次人工巡检的结果未归档和保留,更无法查询,造成运维巡检数据丢 失,得不到有效积累,更无法通过历史运维数据挖掘深层次信息。 6、 应用的资源和环境申请源源不断,导致了运维人员大量时间花费在环境部 署和复核方面,未及时复核的、不满足配置与基线规范的系统往往存在较大的 系统、数据库、中间件、高可用等安全风险隐患,随着系统运行和业务激增, 业务故障后,方才发现配置的不合规性。 (1)基础架构的标准规范无法得到有效落地,形成一?纸空文。 (2) 系统上线前基础环境的配置与基线误配、错配和漏配导致的运行风险陡 增。 (3) 依靠人工的检查和上线前基础环境复核的点过多,难以面面俱到,同时 复核到位程度也跟运维人员的能力有关,隐藏配置不合规风险问题依旧存在。 二、总体规划 为有效解决我行现有痛点,对照我行固本强基、提质增效的工作总要求,我科 坚决革故鼎新,在运维领域坚持自主运维与科技创新齐进,推动运维领域工作 迈向信息化、数字化、自动化、智能化、场景化转型。因此在我行现有基础监 控、动力环境监控、网络监控、硬件监控、业务性能监控等监控子系统,和集 中监控平台、运维大数据平台、运维流程平台等统一平台的基础之上,进一步 拓展、扩大运维体系架构和覆盖范围,例如终端性能监控、应用性能监控和网 络性能监控等监控子系统,统一 CMDB平台、自动化运维平台和IT可视化平 台等统一平台。整体规划架构图如下所示: I T架构可视化集中监控平台CMDB丄自动化运维平台自动化运维系统批1调度自动化自动化投产 I T架构可视化 集中监控平台 CMDB 丄 自动化运维平台 自动化运维系统 批1调度自动化 自动化投产 1、 监控体系架构简介:满足业务系统端到端监控的需求。建立用户APP、WEB、 客户端等终端的终端性能和体验监控

文档评论(0)

素履以往 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档