接地气的DevOps运维自动化.pdfVIP

  • 1
  • 0
  • 约4.94千字
  • 约 8页
  • 2024-10-13 发布于河南
  • 举报

接地气的DevOps运维自动化

【摘要】DevOPS

很多人把与运维自动化紧绑,认为只有实现了容器化,只有实现了

自动编排等等才算是实现了运维的自动化。且不说有多少企业可以完全实现这种IT转

型,就概念本身而言,这也是一种不太合乎逻辑的思维。那么接地气的运维自动化如

何设计和建设?

1.何为运维自动化?

DeVoPS

何为数据中心的自动化运维?很多人把与运维自动化紧绑,认为只有实现了容

器化,只有实现了自动编排等等才算是实现了运维的自动化。且不说有多少企业可以

完全实现这种IT转型,就概念本身而言,我觉得这也是一种不太合乎逻辑的思维。我

们来看Gartner对运维自动化的理解“通过运维工具或平台,实现IT基础设施及业

务应用日常任务处理和运维流程的自动化,从而提高效率和降低风险,促进运维组织

的成熟和各种能力的升级”。从传统企业数据中心运维工程师角度来看,所谓自动化

运维,即在最少的人工干预下,结合运用脚本与第三方工具,保证业务系统7*24小时

高效稳定运行。所以,笔者认为最接地气的运维自动化即为在企业数据中心原有

IT基础架构条件下,能够实现IT资源标准化定义,并且实现运维数据采集、加

工、分析的自动化流程,最终能保障IT运维的及时性和效率化的建设体系。

2.运维自动化框架

首先,我们先来从企业数据中心运维发展的历史阶段来分析运维自动化。从很多传统

企业来看,尤其是金融企业的数据中心,大部分已经经历了三个阶段:

(1)复运维工作精简化的阶段,利用标准统一的工作流来避免重复的人力工作;

(2)局部运维工作自动化的阶段,在不同的系统上部署针对不同对象的脚本来收集处理

运维数据;

(3)IT运维平台整合自动化的阶段,平台实现IT基础架构的半自动化运维。

总结以上历史阶段的发展过程,运维自动化的最初目的是为了提高效率和准确率的基

础之上减少人力成本投入。运维具体工作内容包括:日常监控任务中的日志配置、数

据采集、报警过滤等;日常运维任务当中的脚本执行、系统安装、配置备份、配置检

查、配置变更、补丁分发等;作业调度中的应用发布流程、应用部署流程、变更流

程、故障处理、灾备切换、资源交付等。那么,要实现对以上所有工作内容的自动化

整合需要经历以下三个步骤的建设:

首先,实现标准化是实现自动化的前提条件,因为自动化的工作流是必须要在标准化的

基础之上才能实现识别、判断、处理等相关动作。标准化又包括资源定义的标准化、工

作流程的标准化以及数据的标准化;然后,需要选择数据采集的工具和方式,因为所有

的自动化动作都是基于数据判断的基础上采取的后续步骤;最后需要对采集来的数据进

行加工处理以及最终的分析和决策,这里面包括常规性的决策、为后续采取动作需做的

评估和预警、需要根据数据变化及时做出的动态调整等。

3.数据标准化体系建设

3.1资源标准化.

所谓资源的标准化,涉及到的资源主要包括设备、系统、软件等三类对象资源。

针对物理设备的标准化,首先,我们需要做到对物理设备的资产定义标准化。

例如:对设备的命名、地址、位置、配置、参数、管理等一系列属性信息的定义需要

有统一规划标准。不一定是一个标准,但是一定要建立一系列标准模板。其次,我们

需要对物理设备的规划使用设置标准。例如:设备的网络配置、远程控制、存储配置

等方面的配置使用标准。最后,我们需要对设备使用设置运维管理标准。例如:设备

当中的硬件环境的报警阀值规则定义。

针对系统层面的标准化,首先,与物理设备类似的资产定义标准化。例如:操作系统

的主机名称、类型、版本等相关资产属性信息的标准化定义。其次,关于系统的标准

DNS.NTP

化配置管理。例如:操作系统的初始化配置(地址、网关、掩码、、内核参数

调优、日志、存储使用、Agent)最后,我们需要对操作系统设置运维监控标准。例

o

CPUIO

如:使用率、内存使用率、硬盘使用率、延时、

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档