互联网行业运维部运维员系统故障处理手册.docx

互联网行业运维部运维员系统故障处理手册.docx

互联网行业运维部运维员系统故障处理手册

第1章

1.1故障分级标准与响应时限

运维员需依据《系统故障等级评估模型》对故障影响范围进行量化判定,将故障分为P0(核心业务中断)、P1(非核心业务受损)、P2(功能模块异常)三个等级,其中P0故障定义为核心交易链路(如支付、订单)中断或核心数据库(如MySQL主从延迟3秒)不可用,此类故障必须在15分钟内完成响应;P1故障指非核心业务(如报表、广告位展示)出现异常,需在30分钟内响应;P2故障仅涉及辅助功能,需在1小时内响应。响应时限的设定直接挂钩业务连续性目标,P0故障的SLA(服务等级协议)要求系统可用性

文档评论(0)

1亿VIP精品文档

相关文档