接地气的DevOps运维自动化.docx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

接地气的DevOps运维自动化

?

?

【摘要】很多人把DevOps与运维自动化紧绑,认为只有实现了容器化,只有实现了自动编排等等才算是实现了运维的自动化。且不说有多少企业可以完全实现这种IT转型,就概念本身而言,这也是一种不太合乎逻辑的思维。那么接地气的运维自动化如何设计和建设?

1.何为运维自动化?

何为数据中心的自动化运维?很多人把DevOps与运维自动化紧绑,认为只有实现了容器化,只有实现了自动编排等等才算是实现了运维的自动化。且不说有多少企业可以完全实现这种IT转型,就概念本身而言,我觉得这也是一种不太合乎逻辑的思维。我们来看Gartner对运维自动化的理解“通过运维工具或平台,实现IT基础设施及业务应用日常任务处理和运维流程的自动化,从而提高效率和降低风险,促进运维组织的成熟和各种能力的升级”。从传统企业数据中心运维工程师角度来看,所谓自动化运维,即在最少的人工干预下,结合运用脚本与第三方工具,保证业务系统7*24小时高效稳定运行。所以,笔者认为最接地气的运维自动化即为在企业数据中心原有IT基础架构条件下,能够实现IT资源标准化定义,并且实现运维数据采集、加工、分析的自动化流程,最终能保障IT运维的及时性和效率化的建设体系。

2.?运维自动化框架

首先,我们先来从企业数据中心运维发展的历史阶段来分析运维自动化。从很多传统企业来看,尤其是金融企业的数据中心,大部分已经经历了三个阶段:

(1)复运维工作精简化的阶段,利用标准统一的工作流来避免重复的人力工作;

(2)局部运维工作自动化的阶段,在不同的系统上部署针对不同对象的脚本来收集处理运维数据;

(3)IT运维平台整合自动化的阶段,平台实现IT基础架构的半自动化运维。

总结以上历史阶段的发展过程,运维自动化的最初目的是为了提高效率和准确率的基础之上减少人力成本投入。运维具体工作内容包括:日常监控任务中的日志配置、数据采集、报警过滤等;日常运维任务当中的脚本执行、系统安装、配置备份、配置检查、配置变更、补丁分发等;作业调度中的应用发布流程、应用部署流程、变更流程、故障处理、灾备切换、资源交付等。那么,要实现对以上所有工作内容的自动化整合需要经历以下三个步骤的建设:

首先,实现标准化是实现自动化的前提条件,因为自动化的工作流是必须要在标准化的基础之上才能实现识别、判断、处理等相关动作。标准化又包括资源定义的标准化、工作流程的标准化以及数据的标准化;然后,需要选择数据采集的工具和方式,因为所有的自动化动作都是基于数据判断的基础上采取的后续步骤;最后需要对采集来的数据进行加工处理以及最终的分析和决策,这里面包括常规性的决策、为后续采取动作需做的评估和预警、需要根据数据变化及时做出的动态调整等。

3.?数据标准化体系建设

3.1资源标准化

所谓资源的标准化,涉及到的资源主要包括设备、系统、软件等三类对象资源。

针对物理设备的标准化,首先,我们需要做到对物理设备的资产定义标准化。例如:对设备的命名、地址、位置、配置、参数、管理等一系列属性信息的定义需要有统一规划标准。不一定是一个标准,但是一定要建立一系列标准模板。其次,我们需要对物理设备的规划使用设置标准。例如:设备的网络配置、远程控制、存储配置等方面的配置使用标准。最后,我们需要对设备使用设置运维管理标准。例如:设备当中的硬件环境的报警阀值规则定义。

针对系统层面的标准化,首先,与物理设备类似的资产定义标准化。例如:操作系统的主机名称、类型、版本等相关资产属性信息的标准化定义。其次,关于系统的标准化配置管理。例如:操作系统的初始化配置(地址、网关、掩码、DNS、NTP、内核参数调优、日志、存储使用、Agent)。最后,我们需要对操作系统设置运维监控标准。例如:CPU使用率、内存使用率、硬盘使用率、IO延时、网络状况、进程指标、运行时间等。一方面需要确定运维监控的指标,另外一方面需要确定每一个指标或者指标组合的阀值预警判定规则。

针对软件(主要是指系统上运行的数据库及应用中间件)层面的标准化,首先,我们需要对应用中间件的使用进行标准化管理。例如:数据库的类型和版本、同类中间件的类型和版本。其次,需要对所有软件的初始化以及配置使用进行标准化管理。例如:软件安装配置规范、配置文件规范、配置脚本规范、日志收集规范、端口监听规范等。最后,我们同样需要对软件的运维监控设定标准。也就是需要监控的软件服务指标体系,以此来判断软件提供的服务的正常与否以及性能如何。

3.2流程标准化

所谓流程标准化就是指在数据中心运维管理过程当中涉及到的日常工作流程的标准化管理。如果没有工作流程的标准化规范,那么所有的运维工作就会变成随机性流程,这样的流程是没有办法利用脚本或者软件工具来实现自动化的。具体说来,数据中心运维

文档评论(0)

132****1393 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档