网维大师系统虚拟盘 顺网无盘.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网维大师系统虚拟盘 顺网无盘 初步了解问题描述: 前几天接到一位朋友求助,一个150多台机器的有盘换无盘的网吧,用了2台系统虚拟盘服务器,1台游戏虚拟盘服务器,说是装了网维大师系统虚拟盘1个月之后,大概每天晚上8~10点左右开始频繁出现客户机集体卡死,然后蓝屏,蓝屏代码77或者7e居多,重启后,卡在dhcp分配ip结束之后的界面上不动,重启网维大师系统虚拟盘服务之后就好,偶尔在凌晨2点左右也会出现这种问题。 后来换了个交换机好了一个星期,之后又开始出现类似问题,部分客户机卡死,蓝屏重启,重启后到dhcp分配完ip界面就卡死的问题,必须重启系统虚拟盘服务才会恢复正常。 折腾了一个多星期了都无果,老板已经要抓狂了,因为每天都会出问题,顾客已经是怨声载道,生意逐步开始滑落… 初步判断: 根据初次了解的情况来看,有点纠结,首先第一个非常可疑的地方,最初是正常的,用了大概一个月之后开始出现问题,期间未更换过软件版本,都是最新的1010,所以初步定位是硬件故障所致,用了一段时间之后可能因为硬件质量或者寿命的关系,出现了问题。因为这位兄台说,换了交换机之后好了一段时间,根据个人的经验来说,一个普通的傻瓜交换机,背板也有48Gbps的带宽,在150台机器的网吧做核心交换机肯定是够的,于是建议他把下面接入交换机D-LINK2204拿去做核心交换机观察。%L3 tF5 eJ6?1|%V8 f 但是这个问题另外一个奇怪的地方,每天晚上8~10点左右最爱出问题,根据绝大部分网吧的上座率来分析,这个时间段应该是人比较多,问了一下这个时间段人是比较多,但是白天人也挺多,而且有时候人少时也会出现问题,所以判断这个时间段爱出问题有可能是巧合,或者是人为破坏,也可能是和净网先锋等某些部门的监管软件有关系,所以就建议他把网吧的这类服务器关掉测试。9 r$H+|;g/x4 RK(r0 k 最后一个疑点,重启服务就好,所以除了硬件故障也可能是软件自身bug,虽然俺在顺网上班,但是处理问题还是蛮公正的,毕竟是新产品,难免出现bug,于是根据自己对软件的一些了解,来排查软件上可能遇到的问题,于是就远程连接服务器,查看软件日志,发现在我朋友说重启的时间范围内,确实发现软件重启的记录,但是后来才得知,我所看到的软件重启记录无论是程序自己挂掉,还是手工重启服务(后面分享如何判断服务是挂掉了,还是因为手工重启了服务),都会看到这条记录,所以当时询问朋友的现象只是,当客户机卡死时,服务器进程还在不在,比如ControlServer.exe和DiskLessServer.exe,或者当时服务器cpu使用率和网络使用率是否很高,但是当时只观察了一次,发现进程是在的,cpu使用率不高,网络利用率没注意,那么按照这个说法来看,说明服务并没自动崩溃,软件的重启日志是因为客户机卡死之后,手工重启服务导致的,此时陷入冥想,只好先把日志发给同事分析,结果说是有很多客户机的网络连接被关闭掉了,问题可能处在网络上,于是这点也验证了换交换机后好了一周的说法,那么重启服务就好的疑团还是无法揭开,于是建议朋友用memtest测试服务器内存是否有问题,用硬盘哨兵测试硬盘是否有问题,但是因为测试内存需要停止服务,为了不影响客户机使用,之后次日观察。 )?9 Q#Q+{2 I2 q5 Q6 o#[ 深度纠结: 时间很快,一日过去了,测试也初步有了结果: 1、交换机换了,仍然有挂的。 2、测试内存,无坏块,测试硬盘无错误记录,包括系统日志也全无磁盘错误记录,完全正常. 3、再看软件日志,还是和之前的日志无两样. 说实话,这个反馈结果完全是出乎意料的,因为按照经验来说,软件虽然是新出的,但是稳定性还真没这么差的,既然之前分析日志是说网络断开,那么再从网络上入手吧,结果发现网卡做了汇聚,而实际上当前测试的交换机是不支持汇聚的,同时这块主板上集成的2块网卡也不是同一型号,一个pci-e的,一个pci的,于是建议朋友把网卡汇聚拆掉再观察。 时间还是很快,又一日过去了,测试也有了再次反馈; 1、网卡汇聚取消了,仍然会挂…, .^!l8 Q:j*? 到这里我一定要晕一下,完全没有道理嘛,想想前因后果,问题51%以上是处在硬件上,后来在测试过程中发现服务进程都在的,而且软件的服务重启日志都是手动的,并没自动崩溃的记录,那么硬件故障几率可以提升到90%以上了,于是建议朋友拿一台客户机做测试,弄3块全新的回写盘来做测试,来排除服务器主板自身问题,或者集成网卡问题,或者是硬盘检测不到的错误来排除问题,…另外把2个服务器分开带机,一个服务器带一部分,看看客户机挂掉时,到底是哪个服务器上挂的。 就在百般纠结无语之时,问题另一头的哥们发现服务器中毒了,远程一看,OMG,确实是中毒了,而且服务端的程序都感染了病毒,中的还是很令人抓狂的Win

文档评论(0)

189****6649 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档