- 1
- 0
- 约1.88万字
- 约 29页
- 2026-05-06 发布于江西
- 举报
2025年电信行业运维部运维工故障排查处理手册
第1章
1.1故障现象描述标准化描述需包含具体的物理层技术指标,例如:“检测到端口2的发送光功率为-12dBm,接收光功率为-23dBm,光衰差达11dB,超出正常范围2dB。
必须记录网络设备的运行状态,如“设备处于在线状态,CPU使用率45%,内存使用率32%,无报错日志”,以排除因设备宕机导致的误判。需明确故障发生的业务场景,例如:“用户投诉无法访问核心网站,具体表现为99%的流量被丢弃,且延迟(RTT)从20ms飙升至500ms。记录故障涉及的具体网络拓扑节点,如“故障点位于核心汇聚交换机SW-C的背板端口,且该端口连接了三个业务网段,其中B网段受影响最重”
描述中需包含初步观察到的异常波形或告警信息,例如:“网管系统发出LinkDown告警,并伴随PacketLoss高频告警,同时收到来自用户侧的QoS下降通知”
1.2故障影响范围界定
影响范围界定需区分“物理层影响”与“业务层影响”,例如:“物理层影响为骨干网链路中断,业务层影响为仅B网段用户无法访问,C网段用户正常”必须量化故障对业务系统的具体影响程度,例如:“核心数据库服务器CPU负载达到85%,导致非工作时间无法进行备份作业,预计恢复时间(RTO)为4小时”
需明确故障波及的地理区域或
原创力文档

文档评论(0)