华为PTN故障处理手册v1[1].0.doc

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
华为PTN故障处理手册v1.0 惠州公司网络维护中心 2010年12月 目录 一、 概述 4 二、 网络故障分析定位方法 4 2.1 告警分析法 4 2.2 性能统计分析法 5 2.3 OAM分析法 7 2.4 配置数据分析法 11 2.5 仪表测试分析法 12 2.6 环回法 13 2.7 排除法 14 三、 业务中断故障和业务恢复 15 3.1 流程图 15 3.2 查询误操作 17 3.3 检查告警 17 3.4 检查环回和装载 18 3.5 检查业务配置 18 3.6 应急恢复方案 18 3.6.1 倒换 19 3.6.2 复位 19 3.6.3 通过更换单板恢复业务 19 四、 常见故障处理方法 20 4.1 带内DCN故障处理 20 4.2 MPLS Tunnel故障处理 24 4.3 PW故障处理 26 4.4 CES业务故障处理 27 4.5 以太网业务故障处理 31 4.6 offload故障处理 35 4.7 时钟故障处理 37 4.8 QoS故障处理 39 4.9 线性MSP故障处理 42 4.10 TPS故障处理 45 4.11 LAG故障处理 48 4.12 MPLS APS故障处理 51 五、部件更换注意事项 55 4.13 部件分类说明 56 4.14 更换处理板 57 4.15 更换子卡 59 4.16 更换接口板 60 4.17 更换XCS单板 61 4.18 更换带有1+1保护的SCA单板 63 4.19 更换没有1+1保护的SCA单板 65 4.20 更换风扇板 68 4.21 更换PIU板 69 4.22 更换可插拔光模块 70 4.23 更换CF卡 71 概述 PTN网络故障处理在日常维护中显得至关重要,为了更好的开展PTN网络的日常维护,特编制PTN网络故障处理手册。 本手册PTN设备故障处理主要涉及故障分析定位、业务中断故障应急恢复、常见故障处理方法等三个部分。下面将对这三个部分进行详细说明。 网络故障分析定位方法 根据现网中处理网元脱管或业务中断等故障的经验,一般遵循“一分析,二倒换/复位,三换板”的处理方案。保证PTN网络的稳定运行,尽量减少突发事故。 处理故障时,应从分析故障现象开始,尽快定位到故障的原因。本节介绍各类分析和定位故障的方法、应用场景和应用示例。 告警分析法 告警分析法是定位故障的常用方法之一。当设备发生故障时,一般会伴随大量的告警。通过对告警的分析,可大概判断出发生故障的类型和位置。 通过U2000查询告警:只要在U2000主拓扑的网元图标上点击右键,就可以查询以下告警信息: 当前告警 网元侧历史告警 网管侧历史告警 通过分析、定位告警产生的原因,清除告警,并排除故障。 通过U2000获取告警信息时,应注意保证网络中各网元的当前时间与网管时间同步。倘若网元当前时间与网管时间不同步,将导致信息上报错误。在维护过程中,对某网元重下配置后,应特别注意将该网元的当前时间与网管时间同步。否则网元会工作在缺省时间里,而缺省时间并不是当前时间。 示例一:简单组网中,一般情况下清除告警的同时,故障也随之排除。 如下图所示的链路图中,网管计算机连接到NE2。 故障现象:NE1和NE2之间的E-Line业务中断,NE2上报ETH_LOS告警。 故障分析定位:排查ETH_LOS告警产生的可能原因,最终定位出业务中断故障的原因。清除告警后,业务恢复正常,故障排除。 示例二:复杂组网中,通过分析新增告警和已清除的历史告警,可以找出排除故障的关键所在。某复杂环型拓扑组网突发广播风暴,各网元均出现大量FLOW_OVER告警,业务中断。虽然通过断开环路光纤等方法恢复了业务,清除了FLOW_OVER告警,但无法定位出故障原因。分析全网告警,发现某个UNI端口在上报FLOW_OVER告警的同时,该端口的历史告警ETH_LOS自动清除。沿此线索,发现与该UNI端口对接的第三方设备上出现了远端环回,导致网络上出现环路。解除该环回后,故障彻底排除。 性能统计分析法 性能统计分析法通过统计“当前性能”和“RMON性能”来分析和定位故障。判断单板、端口、Tunnel、PW的性能统计数据是否正常,可以判断是否存在故障。 当前性能:下表区分不同的“对象”,列出当前性能统计的判断标准。 表 ?当前性能统计表 对象 判断标准 对于单板,其光功率、工作温度、CPU/内存占用率应在正常范围之内。 对于端口,应没有误码。 MPLS Tunnel Tunnel没有丢包。 IP/GRE Tunnel Tunnel没有丢包。 以太网业务OAM 没有丢包。 开启网元当前性能统计功能。 网元支持的当前性能的具体含义和解释。 RMON性能:下表区分不同的“对象”,列出RMON性能统计的判断

您可能关注的文档

文档评论(0)

wx171113 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档