传送网元脱管定位思路及处理的方案.docVIP

传送网元脱管定位思路及处理的方案.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
传送网元脱管定位思路及处理的方案

传送网元脱管定位思路及处理的方案   摘 要: 网元脱管是传送网络维护中经常碰到的问题。虽然有时网元脱管并不会影响传送业务,但当网元脱管时,对于传送网隐患的发现会起到很大阻碍,需要尽快处理,否则有可能发展成为业务中断重大事故。将通过案例及告警分析对网元托管的处理提供思路。   关键词: 传送网;网元;网管;脱管   中图分类号:TN915 文献标识码:A 文章编号:1671-7597(2012)1110158-01   0 前言   日常问题处理中,脱管问题是网络较多的问题之一,脱管问题原因很多,所需要具备的技能较为综合,包括设备ECC通信原理、网管与设备通信原理等等,有一个清晰的思路,是找到问题症结的关键,本文总结囊括了网元脱管的多种场景,包括各种原因的分析,希望通过本文的学习能够进一步掌握各种脱管问题的分析处理方法。   1 脱管的定义及网管与设备的通信机制和检测机制   脱管就是网管无法对网元(主机)进行正常的管理。其现象主要表现为:网元变灰、网元无法登录。   网管与网关网元会建立socket连接,socket连接检测仅仅是检测网管与网关网元之间的socket连接是否正常,这个检测仅对Qx类型网关网元进行,如果连续3次(每次36秒)未响应,再第4次下发就会置socket中断,上报GNE_CONNECT_FAIL告警;网管与网关网元和非网关网元之间都会进行DCN检测,对网元下发Qx/TL1消息,需要网元进行Qx/TL1响应,如果网元连续2次(60秒一次)未响应,在第3次下发时就会置网元通信中断,上报NE_COMMU_BREAK告警;网管会对网关网元以及非网关网元下发登录命令,如果失败则上报NE_NOT_LOGIN告警。   2 各种故障定位处理   2.1 上报NE_NOT_LOGIN告警   网管登录不上网元,但并不代表网管与网元之前的通信不通,告警是检测后立即上报的;而上报NE_COMMU_BREAK告警表示网元通信不通,同样肯定会伴随NE_NOT_LOGIN告警,该告警至少要2分钟(2×60秒)才会上报;而上报GNE_CONNECT_FAIL   告警表示网关通信失效,与该网关相关的非网关网元应该有脱管现象,该告警从检测故障起108秒(3×36秒)才会上报;   NDCNTestTimeoutCount参数,该参数即上面提到的DCN检测的参数,缺省为2,即连续2次(60秒一次)未响应,第三次置网元通信中断。可以在ems.cfg中增加nDCNTestTimeoutCount=2   这一行,把该参数改大可以缓解网管上网元频繁脱管的现象,但该方法治标不治本,无法根本解决DCN网络差的问题,一般是不建议使用的。   2.2 单个网元脱管和多个网元脱管   脱管有单个网元脱管和多个网元脱管,单网元脱管的原因一般有:网元ID冲突、主控故障、光板故障、网元用户不正确、所属网关设置不正确等等;单网元脱管的定位可以参考以下流程图:   2.3 ECC风暴   ECC风暴的根本原因是ECC本身不适合大组网导致的,组网过大,路由计算下降,当网络变化时,路由广播信息不断在整个网络中广播,造成路由不断重算,导致路由表收敛时间过长。根本解决ECC风暴的方法是ECC划分,保证性能的情况下要求小于等于64个网元,基本可用的情况下要求小于或等于80个网元。   2.4 GNE_MGR_LIMIT_OVER告警   该告警是检测网管侧网关网元所管理的非网关网元数目,超过缺省的64个则会上报该告警,起到提醒用户组网过大避免发生ECC风暴的作用,若现网很难做到64个网元以下,那么处理该告警的方法可以通过修改ems.cfg配置文件,增加GneMgrLim   ItLevel=64一行,把值修改为比实际非网关网元数量大的值即可,但不建议一味改大,否则该告警的作用将失去意义,建议尽量别超过100;确实不需要该告警作为提醒,也可以对该告警进行过滤处理。   2.5 网关网元脱管   网关网元也脱管的情况下,此时需要检查网管到网关之间的DCN是否正常,可以先从网管服务器上ping脱管网关的IP地址,若不通则需要确认网管服务器到网关网元的具体DCN网络的组网,然后逐步排查DCN网络的故障,DCN网络组网种类繁多,具体的定位方法在此就不过多进行赘述。如果能够ping通网关网元,但是还是无法登录,那么可以从服务器上尝试使用navigator工具来登录网元,判断是否为网管问题导致,如果navigator工具也无法登录,可以通过telnet网关网元IP 1400,测试网管与网关之间TCP通信的1400端口是否通,如果不通需要检查服务器操作系统上的防火墙以及杀毒软件等设置是否存在禁用端口的情况。   2.6 网元互踢脱管

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档