电信行业网络部网管网络故障处理手册.docxVIP

  • 2
  • 0
  • 约2.23万字
  • 约 32页
  • 2026-05-17 发布于江西
  • 举报

电信行业网络部网管网络故障处理手册.docx

电信行业网络部网管网络故障处理手册

第1章故障发现与初步评估

1.1告警信息收集与分级

首先需通过网管系统(NMS)或运维监控平台(如SolarWinds、Zabbix等)的“实时告警中心”界面,按时间轴(Time-Series)回放最近30分钟的告警日志,确保不遗漏任何来自不同设备厂商(如华为、中兴、烽火、思科等)的告警源,并记录告警ID与时间戳。对收集到的海量告警进行初步清洗,剔除因网络拥塞导致的误报(如重复误报告警、周期性抖动告警),重点关注包含“Critical、“High、“Medium、“Low等严重程度的关键字段,优先处理标记为Critical或High的告警。

利用告警关联分析工具,将同一故障点下的多个告警进行聚合,识别出单一故障源(例如:确认是某台核心交换机端口故障而非全网链路中断),避免将局部故障扩大为全局事故。根据电信行业标准(如YD/T系列),结合告警产生的环境(如机房温度、湿度、电压),判断告警是否属于环境类故障(如雷击、停电、温湿度异常),若属于环境类则需立即上报并启动应急预案。依据故障对业务的影响程度,对告警进行分级:将“业务中断”、“数据丢失”、“核心网中断”等直接导致业务停摆的告警列为一级故障(最高优先级),将“性能下降”、“资源告警”等列为二级故障。

记录告警产生的拓扑位置(如:核心交换区、接入层、传输

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档