- 2
- 0
- 约2.74万字
- 约 38页
- 2026-05-16 发布于江西
- 举报
电信行业网络部网络管理员网络故障排查手册(执行版)
第1章故障现象识别与初步诊断
1.1故障现象采集与记录规范
采集前需明确故障发生的时间窗口与环境背景,例如在凌晨03:15收到用户投诉“无法访问内部服务器”,此时应优先记录当时的网络负载状态,如带宽使用率是否接近100%,以便后续分析是否为突发流量导致的拥塞。必须按照“时间-地点-人物-事件”(5W1H)原则进行结构化记录,具体范例为:记录地点为省公司总部大楼A座,受影响的部门为财务部,事件为“无法登录到ERP系统”,时间精确到分钟,避免模糊描述如“大概的时候”或“刚发生”。
需区分故障现象的客观事实与主观推测,严禁将“网络卡顿”直接等同于“网络故障”,应记录具体的可观测指标,如浏览器加载页面时的具体错误代码、DNS查询超时时间或特定IP段丢包率,例如/24网段Ping响应时间超过200ms。记录时应包含环境变量的关键信息,如机房温度、湿度及电源状态,若故障发生前曾进行过大型变更,必须附带变更日志摘要,例如“故障前1小时进行了数据库备份操作,但无报错信息”。对于涉及多用户的故障,需统计受影响用户数量及业务中断时长,例如“影响50名员工,业务中断持续15分钟”,并记录用户反馈的具体症状,如“部分桌面显示蓝屏”或“邮件服务器接收失败”。
在记录过程中需标注信息来源
原创力文档

文档评论(0)