- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
EoC问题分析报告.doc
针对绍兴县64、74局端软件问题的分析
故障现象
近期绍兴县EoC网络中总共出现以下五类故障现象:
终端状态出现黑名单、未授权的现象。
新接入终端无法注册;或者重启局端后,发现终端状态从离线变成在线。
删除终端后,终端显示离线、黑名单、未授权。
64局端在升级之后出现web页面出错的情况。
64局端在升级完成,运行一段时间后,出现能ping通但telnet无法正常工作的情况。
问题分析
1、终端状态出现“黑名单”、“未授权”的现象。
分析:由于线路干扰较多,通信误码较高(局端可以探测到终端,却获取不到完整的终端信息),导致终端无法完成全部注册过程,导致终端会在列表中显示为黑名单、未授权。
结论:实际此类终端属于信号质量较差,需要现场排查网络问题。
解决办法:
对终端进行“接入控制”、“授权”的初始化;
实时显示链路质量。局端可以探测到终端,却获取不到完整终端信息的情况认为是链路质量差,在web网管里面会实时显示。
软件版本:6.6.1.4;64软件3.6.0.6版本同步解决该问题。
2、新接入终端无法注册;或者重启局端后,发现终端状态从离线变成在线。
分析:此问题是在更改注册机制,由新升级后的版本引起。
终端上线的注册机制说明
局端软件中是进行的,。
,1位,每注册完成一个终端后,队列会空余1位,按次序如此,可完成所有终端的注册过程。
发现终端后,会去判断当前。如果,进行注册;如果已,则,。
出现故障后,技术人员复查软件代码时,发现局端软件中存在,
故障可能性分析
1)由于线路状况复杂,可能存在终端在注册过程中出现信息传输出错的情况,因此,终端注册会因通信出错而异常终止,从而激活bug。
2)刚刚上电的终端,在注册到一半时,突然断电或断开同轴电缆,也会引起注册信息不完整而激活bug。
实际故障点查询分析
针对这类故障,我们查询了局端10.12.56.88下的终端53,终端53属于存在较大噪声干扰的终端。
通过截取局端的log记录信息,发现该终端确实在重复注册,但因确实干扰较大,每次注册都失败,导致了该局端注册队列被填满,终止了其他终端的注册过程。
结论:此现象为软件bug导致。
解决办法:
1)注册失败的终端信息,移出注册队列,另外登记;
2)重复注册失败的终端,记录最后一次注册信息,不重复登记。
软件版本:6.6.1.5;64软件3.6.0.7版本同步解决该问题
删除终端后,终端显示离线、黑名单、未授权。
分析:该故障是在正常终端被删除后出现,且该类故障出现的局端下,均有问题2故障存在。
当问题2出现之后,新终端的注册过程将会由于注册队列被填满而终止,因此,当终端被删除后,当成新终端重新注册的时候,会因为无法正常进入注册队列而不能正常注册。
结论:故障原因与问题2相同,属于软件bug导致。
解决办法:
1)注册失败的终端信息,移出注册队列,另外登记;
2)重复注册失败的终端,记录最后一次注册信息,不重复登记。
软件版本:6.6.1.5;64软件3.6.0.7版本同步解决该问题
64局端在升级之后出现web页面出错的情况。
一般情况下,web页面是以文件为基础,在文件中填写数据后生成新文件而完成web的创建,因此web页面出错首先是文件出错。查询该出错局端下的web文件,发现确实出错。
分析:由于文件的读取及写入过程,均有linux系统专用流程来自动完成,而导致该流程出错的原因,一般为内存分配出错导致。64系统主芯片88E6218属于早期的CPU,该CPU不带内存管理单元,内存的分配及收回均由应用软件自己完成,容易出现分配出错的情况。
根据故障查找内存分配问题,发现ceserver进程在修复之前注册bug的时候,多出了一个内存分配错误,该错误会导致系统内存出错,而引起系统对文件读写出错,还可能导致系统资源消耗而引起其他问题。
结论:内存出错引起。
解决办法:
找出内存分配出错点;
修改web数据生成方式,由以前写入文件系统的方式改为写入内存,直接在内存中生成,以避免多次对文件系统读写带来额外的出错可能。
软件版本:升级到3.6.0.8解决。
64局端在升级完成,运行一段时间后,出现能ping通但telnet无法正常工作的情况。
分析:此问题类似与问题4,属于内存分配出错导致。Ceserver内存分配出错,导致系统资源消耗,直接影响了telnet进程,导致telnet进程与ceserver之间的通信出错,无法实现正常的telnet功能。
结论:内存出错引起。该问题与问题4是同一问题。
解决办法:找出内存分配出错点。
软件版本:升级到3.6.0.8解决。
总结
此次出现的5类问题,实际上是三类,第一个问题是起因,2、3两个问题是在修正第一个问题时出现的注册过程软件设计bug,4、5两个问题是在修复64局端注册过程软件设计bug的同
文档评论(0)