企业级自动化运维方案设计.pdf

企业级自动化运维方案设计 1.企业运维现状与发展趋势 随着企业信息化的不断发展,运维人员需要面对越来越复杂的业务和越来越多样化的用户需 求,不断扩展的应用需要越来越合理的模式来保障运维服务能灵活便捷、安全稳定地持续。 某企业从初期的几台服务器发展到庞大的数据中心,单靠人工已经无法满足在技术、业务、 管理等方面的要求,那么标准化、自动化、架构优化、过程优化等降低运维服务成本的因素 越来越被人们所重视。其中,自动化开始代替人工操作在企业的运维过程中逐渐体现出来了 强大的优势。 运维随着企业业务的发展,自动化作为其重要属性之一已经不仅仅只是代替人工操作,更重 要的是深层探知和全局分析,关注的是在当前条件下如何实现性能与服务最优化,同时保障 投资收益最大化。通过自动化运维能最大限度地在更少的维修时间内实现运维目标,提高运 维服务质量。因此, 对于越来越复杂的运维来说,将人工操作逐渐改变为自动化管理是一个 重要发展趋势。 2.企业运维存在的问题与需求 某企业初期只有文件共享和邮件服务等几台服务器,运维工作完全由人工操作,随着企业的 发展,新业务系统不断上线企业建设了中心机房,运维工作还是以人工为主,但是这一阶段 增加了网络管理系统和环境监控系统,这两个系统在一定程度上减轻了运维的工作量,基本 上实现了运维的半自动化。企业在发展,运维工作量在不断的增加,企业的运维工作面临以 下的问题及需要解决: 2.1 运维人员的工作效率与工作主动性需要提升 在企业运维过程中,只有当故障已经发生并且造成业务影响时才能发现和着手处理,这种被 动 “救火”不但使运维人员终日忙碌,也使运维本身质量很难提高,导致 IT 部门和业务部 门对运维服务满意度都不高。运维人员日常大部分时间和精力是处理一些简单重复的问题, 而且由于故障预警机制不完善,往往是故障发生后或报警后才会进行处理,使得运维人员的 工作经常是处于被动的状态,怎样才能在故障发生前及时发现并把故障处理掉,使运维工作 变被动为主动? 2.2 需要建立一套高效的运维机制 企业在运维管理过程中缺少自动化的运维管理模式,没有明确的运维人员角色定义和责任划 分,使到问题出现后很难快速、准确地找到根本原因,无法及时地找到相应的人员进行修复 和处理,或者是在问题找到后缺乏流程化的故障处理机制,而在处理问题时不但欠缺规范化 的解决方案,也缺乏全面的跟踪记录,企业需要建立一套高效的运维管理制度为运维工作提 供方向和依据。 2.3 缺乏高效的运维技术工具 随着信息化建设的深入,企业业务系统日趋复杂,各种各样的网络设备、服务器、存储设 备、业务系统等让运维人员难以从容应对,即使加班加点地维护、部署、管理也经常会因设 备出现故障而导致业务的中断,严重影响企业的正常运转。出现这些问题部分原因是企业缺 乏事件监控和诊断工具等运维技术工具,因为在没有高效的技术工具的支持下故障事件很难 得到主动、快速处理。 3.业务流程标准化与健全运维管理制度 3.1 实现业务流程标准化,为自动化运维打好基础 标准化是自动化运维的基础,想要实现标准化,首先识别各个运维对象,然后我们日常做的 所有运维工作都应该是针对这些对象的运维。如果运维操作脱离了对象,那就没有任何意 义。同样,没有理清楚对象,运维自然不得章法。例如扩容,首先确定是服务器的扩容,还 是应用的扩容,还是其它对象的扩容。你会发现,对象不同,扩容这个场景所实施的动作是 完全不一样的。如果把服务器的扩容套用到应用的扩容上去,必然会导致流程错乱。同时对 于对象理解上的不一致,也会增加无谓的沟通成本,造成运维效率低下。这种情况下的自动 化运维不但不能提升效率,还会越自动越混乱。 实现标准化的第一步是物理基础设施的标准化,例如,识别物理对像服务器、交换机、机柜 等硬件;识别这些物理对像的属性,服务器的序列号、ip 地址、厂商等信息;识别这些对 像之间的关系,服务器所在的机柜、接入哪个交换机的哪个接口了等信息。服务器物理基础 设施的标准化如下图(其它设备的标准化以此类推): 2lzx2w16zaq 第二步是应用的标准化,应用服务、中间件,数据库等;例如,数据库的表、视图、存储过 程的标准化,表的字段名、值,索引等,表和视图之间的关联关系等。 第三步是流程标准化,如备份、软件升级、杀毒,新业务上线等流程的标准化,下图是现在 的运维流程: zq7iv1p1lr 自动化运维是基于流程化的框架,将事件与IT 流程相关联,一旦被监控系统发现性能超 标,超过预先配置的阀值或宕机,就会触发相关事件以及事先定义好的流程,可自动启动故 障响应和恢复机制。自动化工作平台还可帮助运维人员完成日常的重复性

文档评论(0)

1亿VIP精品文档

相关文档