华为交换机STP及环路检测冲突.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
华为交换机STP与环路检测冲突 字体大小:大 | 中 | 小 2008-02-11 16:26 - 阅读:871 - 评论:0 中国银行福建省分行选择华为3Com公司具有线速交换能力的系列局域网交换机Quidway S8016、S3050组建大楼局域网。为了保证网络的 可靠性,使用两台QuidWayS8016作为核心交换设备来进行整个大楼局域网络的三层交换处理,之间运行VRRP协议进行负载均担和备份保护。楼层交 换机采用QuidWayS3050设备,每台交换机与两台核心交换机组成光纤环路,启用RSTP协议进行链路备份。图1是网络拓扑图。 故障情况简单描述   不久福建省中行的网络出现故障,赶到5楼机房,发现8016B上有很多RSTP不断重新计算以及下连3050C的光口 不断Forwarding/Discarding迁移的信息。此时8016B上也有VRRP主备倒换的告警信息,因为上次已经减少VRRP组数并错开各个 VRRP组的Hello报文时间间隔,故此时VRRP切换并不集中。由于同时有大量生成树协议的BPDU报文上送CPU重 新计算以及因生成树计算错误导致的部分VRRP组主备切换,两台8016上的CPU利用率很高,网络基本不可用。首先断电8016B,恢复业务,再仔细分 析日志信息,并询问网络改动,发现故障情况与新增一台3050C有关系。断开新增的3050C,恢复双机环境,网络运行正常。初步判断此次网络动荡与新增 的3050C有关。 故障原因分析   1.新加的3050C没有升级,存在STP方面的缺陷。   3楼新增加的3050C是原来的备用机,使用的是 0019版本,没有升级到中行目前在用的0022版本,该版本存在缺陷,可能会丢弃部分STP协议报文不上送CPU处理,导致RSTP计算错误和网络形成 广播风暴。从0020版本以后已经解决,目前中行在用的0022版本也不存在该问题。因此我们建议把3楼的3050C升级之后再接入到网络中。   2.3楼新增3050C没有关闭上行端口的环路检测功能(loopback-detection)华为3Com交 换机上有环路检测功能,可以配合生成树协议(STP/RSTP/MSTP)有效地检测网络中的环路,生成树协议主要用于检测拓扑环路,环路检测功能可以有 效检测端口下的环路。环路检测功能是基于端口和VLAN的,当检测到端口存在环回后,首先会上报LOG,提示某个端口在某个VLAN中存在环回情况,并设 置该端口不再学习MAC地址,端口的流量和其他端口隔离,从而进入一个该端口下面存在环路而不影响其他端口的状态。但与此同时,一些正常的协议报文,比如 生成树协议的BPDU报文,也无法通过了,这样会导致生成树协议计算错误。   同时,如果STP计算错误,没有把相应的链路Discarding 掉,就会引起环路检测功能检测到网络中存在的环路,并会把收到环路检测报文的端口UP/Down一次,这将引起全网RSTP协议的重新计算,影响到所有的 交换机,耗费大量的CPU资源。在没有关闭上行口环路检测功能的3楼新增3050C上的告警信息也证实了上述判断。   如果形成如图2所示的环路,可能会导致环路检测报文从一个上连口出去,从同一台设备的另一个上连口返回,出现告警信息。   如果形成如图3所示的环路,可能会导致环路检测报文从一个上连口出去,从同一台设备的另一个上连口返回,即出现如告警信息。   3.STP重新计算和VRRP主备倒换,导致设备CPU利用率高和网络动荡,由于STP协议报文和VRRP报文都要上送到CPU处理,占用大量 的CPU资源。当新增3050C的环路检测功能和STP缺陷导致整网的STP计算错误,网络设备不断重新计算STP,并发生端口不断迁移,导致网络发生较 大动荡,这时候CPU利用率在60%~65%,甚至更高,这样就可能影响正常数据转发。 ??? 故障排除步骤   1.查看设备故障现象,发现RSTP协议计算导致端口不断迁移,以及VRRP切换,CPU利用率60%~65%,判断应为环路所致,在Down掉一些端口无效后,为确保业务不受影响,断电8016B,恢复网络和正常业务。   2.拔下8016B的光纤和电缆,再裸机加电,查看8016B的日志,分析故障原因,发现出现故障时候有大量的RSTP端口迁移,而且故障时间与下午增加3楼3050C的时间吻合。   3.登录到3楼新增加的3050C,发现其没有升级也没有关闭上行口的环路检测功能,其日志中有环路告警,可能因该交换机的STP报文处理缺陷和环路检测功能导致RSTP计算错误,最终引起设备CPU利用率高以及网络动荡。   4.断开3楼新增的3050C,再逐步恢复8016B的光纤和电缆连接,网络正常。观察至今一直稳定。   5.升级新增加的3050C,关闭上行

文档评论(0)

xuefei111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档