云平台运维管理方案.docx

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
云平台运维管理方案 运维组织架构 运维组织架构 针对云平台项目,在运维服务组织架构方面,不同与传统垂直维护模式,而是按照云平台层级的构成进行了组织架构的设计,除了传统维护职能组外,增加了虚拟化层维护组和业务平台维护组。IDC运维中心按照统一监控,统一调度,分层运维的模式,构建如下运维组织: 岗位职责 岗位职责 职责 运维总负责 全面负责运维管理服务目标的达成。 负责组建运维团队组织。 全面负责运维管理服务过程中检查、敦促、指导工作。 全面负责监督和改进运维管理的工作质量。 硬件维护组 负责网络、存储日常维护工作,确保相应设备能够正常工作。 负责服务器及操作系统日常维护工作,确保其能够正常工作。 负责存储日常维护工作,确保相应设备能够正常工作。 负责数据的日常备份管理工作。 负责硬件安全例行运维工作。 虚拟层维护组 负责云产品虚拟资源的资源调度及管理工作。 负责云管理平台的维护工作。 负责虚拟层面的例行安全防护工作。 业务平台维护组 负责中间件、数据库、应用系统等维护工作。 负责虚拟机系统的日常维护工作,确保其能够正常工作。 负责应用层面的例行安全防护工作。 机房管理组 对机房环境及机房基础设施的稳定运行负责。 机房基础设施设备的日常维护工作。 负责机房的日常巡检工作。 运维管理流程 为了保障云平台的服务质量,基于ITIL运维管理最佳实践,在本项目中定义的运维管理流程包括:事件/故障管理流程、变更管理流程、资源管理流程、监控与告警管理流程、备份与恢复管理流程和运维报告管理。 事件/故障管理 流程目的 事件管理流程的主要目的是尽快解决运维中出现的事件与故障,尽快恢复业务,保障运维服务达到服务水平协议。 通过对事件进行登记、分类、分级、状态跟踪、关闭确认等手段建立一个事件管理流程的闭环,从而对事件的处理过程进行监控和优化。 定期对事件信息进行统计和分析,了解事件与服务请求的分布和发展趋势,降低事件响应时间和解决时间。 流程原则 管理原则 所有IT维护范围内发生的事件,都应该记录在事件管理工具中,记录的信息应足够详细,包括事件处理交互过程,详细的解决方案和相应的附件 所有支持人员对优先级为紧急和高的事件所采取的服务恢复行动,在比对其它行动的时候,将拥有优先处理级别 责任人原则 所有权原则用来确保每个事件在任何时段都有适当的人员负责。由用户申报的事件单,服务台是该事件的责任人,必须确保事件得到有效跟踪与解决,并负责事件单的关闭。当事件单被分派后,接单的事件处理员作为此事件当前责任人,负责对事件进行处理。 关闭原则 由用户申报的事件单,关闭必须由服务台完成。事件处理人员在解决完成事件时,根据实际解决情况填写事件的解决方案,服务台负责和用户再次确认事件是否解决。 优先级原则 事件的优先级表明了该事件对用户的业务影响和紧急程度。它是评定事件或服务请求处理优先顺序、解决时限的一个重要指标,优先级决定处理事件的顺序及所需的资源。 目标解决时间原则 为了更好地控制事件的解决过程,事件管理流程被分解成几个阶段。每个阶段都设定相应目标时间。 升级原则 事件的升级方式为技术升级和管理升级。技术升级是基于时限要求或技术能力要求而将事件受理转移给更高级别支持小组的操作。管理升级是指在当前层级无法处理事件时,需要通知管理层,利于资源的投入。 管理流程 变更管理 流程目的 变更管理主要目的是规范云平台生产环境变更活动,确保所有变更行为能准时完成,并且不会导致服务意外中断,降低风险,保证云平台生产环境的稳定性、可靠性、安全性,并最大化地提升云平台的可用性 流程原则 管理原则 所有涉及运行环境的变更都必须严格遵循变更管理流程;所有变更过程信息都应被记录并可追踪。 审批原则 在变更管理流程中应充分考虑“风险”和“效率”的平衡,通过对变更的充分评估和审核控制变更的风险,但对不同类型的变更在流程或审批路径上区别对待,以达到高效的目标。 变更窗口原则 变更窗口原则用于确定变更实施的日程。变更窗口通常选择云平台运行对业务影响最小的时间周期,在规定的变更冻结期内,原则上禁止变更。变更窗口机制应当形成书面文件并公布,供所有参与变更人员使用。 前导时间原则 前导时间是指从提交变更到变更实施之前所需要进行评估、审核等准备活动的最少时间。前导时间是基于变更影响度而定的。实施变更需要适当的前导时间进行评估和制定计划。 回退原则 当变更实施失败或者无法在规定的时间内完成,则需要进行回退。任何回退的变更将作为变更失败而关闭,在下一次实施前,变更请求者必须重新提交新的变更请求单(RFC),以便重新进行审批。 关闭原则 变更实施完毕并且得到确认后,将由变更申请人关闭请求单。变更之后如果引发了其他问题,将更新变更单的信息。 管理流程 资源配置管理 流程目的 通过识别、控制、维护、核对、汇总基

文档评论(0)

一生习武之人 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档