PTN设备故障定位处理指导书.doc

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PTN设备故障定位处理指导书

PTN设备故障维护指导 故障定位处理 目 录 1 前言 4 2 故障处理基本原则 5 2.1 故障处理基本原则 5 2.2 故障处理注意事项 5 3 故障处理流程 6 3.1??故障处理总流程图 6 3.2??故障处理流程说明 6 3.3??故障通报和技术支持 6 4 常见故障处理 10 4.1??带内DCN故障处理 10 4.1??MPLS Tunnel 故障处理 14 4.3??PW故障处理 16 4.4??CES故障处理 18 4.5??以太网业务故障处理 22 4.6 ?时钟故障处理 26 4.7 ?LAG故障处理 28 4.8 ?MPLS APS故障处理 31 5 处理案例 35 5.1 IP地址冲突导致网元间歇性脱管 35 5.2 IP Tunnel承载业务时选择以太Tag模式导致业务不通 37 5.3 用户侧环回导致E-LAN业务出现广播风暴 38 5.4 BTS时钟源配置错误导致业务大量丢包 40 6 部件更换 43 6.1 注意事项 43 6.2 所需工具/仪表 44 6.3 更换处理板 45 6.4 更换子卡 47 6.5 更换接口板 50 6.6 更换交叉板 51 6.7 更换带1+1保护的SCA单板 53 6.8 更换风扇板 56 6.9 更换PIU单板 57 6.10 更换光模块 58 6.11 更换CF卡 60 前言 本文档主要向您介绍了以下内容: 不同维护场景下PTN设备的例行维护项目、维护周期,以及维护步骤。 告警、性能事件的基本概念,设备支持情况及处理方法。 设备的故障处理过程、方法。 更换部件的过程、方法。 本文档主要适用于以下工程师: 系统维护工程师 网络监控工程师 现场维护工程师 故障处理基本原则 故障处理基本原则 请遵循以下原则对故障进行分析、定位和处理: 以尽快恢复系统监控为原则。 定位故障时,应及时采集故障数据信息,并尽量将采集到的故障数据信息保存在移动存储介质中或网络中其它计算机中。 在确定故障处理的方案时,应先评估影响,优先保证业务的正常传送。 第三方的硬件故障,可查看第三方的相关资料或拨打第三方公司的服务电话。 如果无法定位出故障点或无法按手册解决故障,中国区可以拨打华为公司24小时问题受理电话:400-830-2118,其他地区也可以直接联系当地的华为全球TAC服务中心,以获取技术支持,并配合华为公司工程师处理故障,最大程度减少业务中断时间。 故障处理注意事项 应先分析故障现象,定位原因后再进行处理。在原因不明的情况下应避免盲目操作,导致问题扩大化。对于网管的故障修复,不能影响网元的运行。 在处理故障前,需要保留好故障现场的任何记录,不能随意删除数据或日志。 在处理故障时,为了确保客户网络的安全和隐私,如果需要采集相关故障日志,请事先得到客户的同意。 在处理故障时,为了确保系统安全,如果需要向服务器端上传或者从服务器端下载某些文件,推荐采用更加安全的SFTP协议。 在进行任何修改前,应先通过脚本导出、手工备份等方式备份网管的数据。 在系统恢复后,必须对运行情况进行观察,确认故障已经排除并及时填写相关的处理报告。 在Solaris操作系统中,如果启用SetSolaris系统安全加固之后,只有nmsuser用户的ssh服务具有登录权限。为了您的系统安全,推荐使用ssh登录方式。如果需要使用其他登录方式,如telnet,需要先开启telnet服务以及登录用户的访问权限。在SUSE Linux操作系统中,如果启用SetSUSE系统安全加固之后,只有nmsuser用户的ssh服务具有登录权限。为了您的系统安全,推荐使用ssh登录方式。如果需要使用其他登录方式,如telnet,需要先开启telnet服务以及登录用户的访问权限。 故障处理流程 本节介绍故障处理的基本流程图。 故障处理流程图如图1所示。 图1 故障处理流程图 故障处理流程说明 本节对故障处理的流程进行引导说明。 观察并记录故障现象 首先应该仔细观察和了解故障的各种现象并记录下来。 进行故障记录时,力求做到对故障发生的全过程进行真实、详细的记录。对于故障发生的时间,在故障前后所做的操作等重要信息都要进行详实地记录。同时对于网管中的告警信息,性能事件等重要数据也要进行保存。 收集故障相关信息 了解故障现象后,需要收集有助于查找故障原因的更详细信息。如网管结构是否有变动,网管配置是否有更改等。 经验判断和理论分析 利用观察的故障现象和收集的故障信息,根据故障处理经验和所掌握的设备知识分析故障的可能原因。 各种可能原因列表 列出根据经验判断和理论分析后总结的各种可能原因。 对可能原因进行排查 根据所列出的可能原因

文档评论(0)

almm118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档