电信行业网络部运维工网络故障处理手册(执行版).docxVIP

  • 2
  • 0
  • 约2.63万字
  • 约 41页
  • 2026-05-22 发布于江西
  • 举报

电信行业网络部运维工网络故障处理手册(执行版).docx

电信行业网络部运维工网络故障处理手册(执行版)

第一章故障通报与应急响应

1.1故障信息接收与确认

运维监控中心(OCC)需建立7×24小时”实时告警接收机制,利用自动化监控系统(SCM)对核心网元、传输设备及接入层设备的运行指标进行毫秒级采集与解析。当系统检测到异常波动时,必须触发多级告警队列,优先处理来自基站、骨干网及核心交换机的关键指标异常,并将告警信息实时推送至值班工程师的移动端工作终端。值班工程师需遵循“工单标准化录入”规范,在收到告警后30秒内完成故障录入,确保故障描述、发生时间、受影响范围及初步现象符合《故障信息录入模板》要求,严禁模糊描述如“信号不好”或“设备报警”,而应精确标注如“2G小区A掉线率突增至5%,伴随RRC连接失败”等具体技术细节。

收到故障信息后,运维人员需立即执行“三级核实”确认流程:首先通过电话或内部系统确认告警源头的真实性,排除误报干扰;其次通过业务系统数据流核查故障是否已传播至核心网侧;最后通过现场手持终端或远程视频连线确认故障现象,确保“信息源、故障点、现象”三者逻辑闭环,杜绝“报假警”或“漏报”。核实无误后,运维人员需立即启动故障分级评估程序,依据故障对网络可用性的影响程度(如是否影响核心业务、是否需全站抢修)及故障持续时间(如是否超过5分钟)进行定级,并同步《故障初步研判书》,明确故障等级为“一级”

文档评论(0)

1亿VIP精品文档

相关文档