运维应急方案.docVIP

  • 16
  • 0
  • 约2.32千字
  • 约 7页
  • 2021-11-13 发布于广东
  • 举报
word可编辑 word可编辑 PAGE / NUMPAGES word可编辑 运维应急方案 文件状态: [√] 草稿 [ ] 正在修改 [ ] 正式发布 文件标识: 当前版本: 1.0 作 者: 完成日期: 目 录 TOC \o 2-3 \h \z \t 标题 1,1 1 前言 3 2 目标 3 3 组织结构 3 4 应急预警 3 4.1 应急预警级别 3 4.2 应急预警处理流程 4 4.2.1 一级预警处理 4 4.2.2 二级预警处理 5 4.2.3 三级预警处理 5 5 附件 6 5.1.1 故障报告单 6 前言 运维部负责公司业务系统运行维护工作。 为了保障公司因业务系统的平安、平稳运行,运维部特此指定运维应急方案,通过此方案来保证系统的平安。 目标 保障公司玩耍效劳器的正常运行、网络的畅通。 严格岗位制度、明确工作职责,标准工作流程。 工作标准化,制度化,加强文档管理力度。 组织结构 依据运维工作的范围和性质,下设三个小组: 系统维护组 应用维护组 技术值班组 应急预警 应急预警级别 预警级别 预警标志 警报内容 预警级别介绍 一级预警 网络流量上升 主机性能降低 数据备份消灭特别 异地备份消灭特别 某台工作站消灭病毒 监控软件消灭故障 一级预警表示系统消灭故障,但不影响运维系统的正常运转。 二级预警 网络中断或网络设备特别 主机、阵列和带库硬件消灭故障 数据库相关故障 黑客入侵或病毒大面积发作 二级预警表示系统消灭故障,影响运维系统的正常运转,但运维工程师可以在短时间内进行故障排解。 三级预警 网络防火墙宕机无法正常使用。 主机、阵列、带库宕机并无法启动 数据库或数据仓库无法正常使用 受到不行抗力或自然灾难的破坏。 三级预警表示系统消灭故障,影响运维系统的正常运转,运维工程师不能在短时间内进行故障排解或无法排解。 应急预警处理流程 运维过程中消灭重要故障或紧急状况时,按以下规定流程进行处理及汇报。在遇到故障时,准时汇报上级领导并实行措施准时解决,具体汇报流程如下: 一级预警处理 运维过程中,假设遇到一级预警,按以下流程进行处理: 当通过监控或得知系统消灭故障时,首先在最短的时间查看故障点状态,并分析故障缘由。 运维工程师在排查出故障后,马上着手解决。 在故障排解后,对所发生故障的设备进行事后跟踪。 在故障排解后,运维工程师应对故障缘由及解决方法进行具体说明。 二级预警处理 运维过程中,假设遇到二级预警,按以下流程进行处理: 当通过监控或得知系统消灭故障时,首先在最短的时间内查看故障点状态,并分析故障缘由。 马上报告给组长,运维小组长应通过 或当面把故障报告相关部门领导,在故障完全排查清楚后以书面形式递交“故障报告单〞。 运维工程师在排查出故障后,如能够马上解决,那么马上解决故障,如需要设备厂商的技术人员到现场,应马上拨打技术厂商的技术工程师联系 ,恳求马上到现场进行故障排解。 在故障排解后,运维工程师应对故障缘由及解决方法进行具体说明。 三级预警处理 运维过程中,假设遇到三级预警,按以下流程进行处理: 当通过监控或得知系统消灭故障时,首先在最短的时间查看故障点状态,并分析故障缘由。 马上报告给运维中心主管人员,主管人员应通过 或当面把故障报告给相关领导部门,在故障完全排查清楚后以书面形式递交“故障报告单〞。 运维工程师在排查出故障后,如能够马上解决,那么马上解决故障,如需要设备厂商的技术人员到现场,应马上拨打技术厂商的技术工程师联系 ,恳求马上到现场进行故障排解。 假设因硬件设备消灭故障而无法修复,需要更换时,应报运维中心主管人员,主管人员办理硬件更换事宜。 在故障排解后,运维工程师应对故障缘由及解决方法进行具体说明。 附件 故障报告单 文档编号:yw-gzbg-0001 故障报告单 报告人: 报告日期: 故障所属: □ 系统故障 □ 数据库系统故障 □ 网络设备故障 □ 其它应用软件系统故障 故障描述: □ 已解决 □ 未解决 解决方案: 审 核 人: 审核日期:

文档评论(0)

1亿VIP精品文档

相关文档