- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Page * 典型案例(一) 【问题现象】单板概率性故障导致业务中断。出现两次中断,每次中断时间为20分钟。NNI侧采用GE光接口对接。业务中断时,网管上报MPLS_TUNNEL_LOCV和ETH_APS_LOST告警。处理步骤见图 NB 1 NB 1 RNC RNC ETH PTN 1 PTN PTN 3 PTN RNC RNC Tunnel路径 ingress egress 1. 在网管中检查告警信息,发现一段时间内网元有MPLS_TUNNEL_LOCV和ETH_APS_LOST告警。说明TUNNEL在一段时间内连通性失效。 2.检查业务TUNNEL是否正常。使用MPLS TRACEROUTE报文在ingress节点发送来检查TUNNEL路径,发现不正常,说明tunnel是连通失效,导致业务中断。 ETH PTN 2 PTN TRACEROUTE TRACEROUTE 上报网管收到traceroute报文 没发出tracerout报文 从ingress发送traceroute报文后,PTN2可以收到,PTN3收不到traceroute 报文,证明失效路径发生在PTN2—PTN3之间。 告警 是否ARP没学到?? 是否TNL/PW配置不正常?? 是否性能统计不正常?? 3.检查PT2 NNI侧端口是否正确学习到对方MAC,检查NNI侧ARP表,发现正确的MAC地址被概率性修改了,导致ARP协议报文中的“目的MAC地址”被设置为错误的信息(被修改)。而业务正常时,源网元NNI侧出端口学习到的对端端口的MAC地址应是正确的。从中可以判断TUNNEL中断是因为对端ARP地址被修改,导致业务不通。 对端网元收到携带错误信息的ARP报文后,因校验不通过就全部丢弃,ARP协议协商失败,Tunnel中断,业务也随之中断。 经过ARP老化时间后,源网元NNI侧出端口重新学习到对端端口正确的MAC地址,ARP 协议协商成功,业务恢复正常。这是业务恢复正常的原因。 4.继续查询APS保护组,发现保护Tunnel也经过了同一物理链路,故障发生时,工作Tunnel和保护Tunnel同时中断,APS保护组失效。 5. 更换故障单板,避免再次出现小概率性的错误。故障未再发生,问题解决。 因为网管未上报ETH_LOS告警,可以判断出物理链路连接良好。业务中断时间又与ARP老化时间吻合,可以推断故障原因是MAC地址学习失败。 Page * 典型案例(二) 【问题现象】某运营商网络通过在PTN设备上配置专线业务,专线业务穿越波分设备网,一段时间后发现业务中断,PTN2、PTN3上报MPLS_TUNNEL_LOCV告警 。 NB 1 PTN 1 Tunnel路径 ingress PTN 3 RNC 波分设备网 egress PTN3设备上报MPLS_TUNNEL_LOCV告警 1.通过TUNNEL OAM告警得知TUNNEL连通不正常 PTN 2 2.从ingress发送traceroute报文,确定故障点 traceroute traceroute 上报tracerout响应报文 无tracerout响应报文 3.失效路径发生在PTN2—PTN3之间 4.检查端口发现ARP已学到;TNL/PW配置正常,没有发现问题。从PTN2设备向PTN3设备发送包长1000字节PING报文,查看报文响应时间,发现响应超时。 Ping无响应 5.为确定路径时延,在PTN2和PTN3设备上分别打开性能统计,统计发送PING包和收到PING包的时间 打开性能统计计数,查看PING报文发包时间 打开性能统计计数,查看PING报文收包时间 检查性能统计计数,查看PING报文发收包时间,相差10s,可以说明穿越的波分设备网中存在较大延时,导致TUNNEL OAM产生MPLS_TUNNEL_LOCV告警。请波分相关技术人员过来定位,确实是波分设备中存在延时。 Page * 典型案例(三) 【问题现象】激光器状态异常导致LAG组业务中断。某日,客户反馈一条LAG(链路聚合组)上的以太网业务突然中断。该LAG组包括一个主端口,三个从端口。从网管上看,四个端口同时上报LASER_SHUT告警并且激光器确实无光输出,但该四个端口均已使能。 主端口 从端口 LAG组 LASER_SHUT告警 LASER_SHUT告警 1.检查当前告警,发现有LASER_SHUT告警 2.检查上报告警的端口的状态为“使能” 3.查询历史告警,发现单板曾经上报HARD_BAD告警,说明该单板出现过故障,LAG组自动关闭了所有端口的激光器 4.但是当HARD_BAD告警消失时,单板的状态并未随之恢复为正常,导致LASER_SHUT告警一直存在 5.硬复位该单板,单板状态恢复正常,LASER_SHUT告警消失,
文档评论(0)