X86服务器常见故障(下).PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
X86服务器常见故障(下).PDF

X86 服务器常见故障(下) 转自:TT 中国 上文中我们已经总结了一些X86 服务器的常见硬件故障,本文中,我们将继续介绍其 它几种故障。 硬盘 故障回放:某服务器近期经常出现死机、无征兆的重启,经数据中心IT 运维人员进行检测 后发现是硬盘工作时间太长,出现了物理坏道。于是立即将此硬盘拆下,将硬盘内的数据导 出,结果在转移数据的过程中,不停地弹出I/O 错误,这直接导致数据转移的速度非常慢, 且丢失了很多重要数据。 解决方案:这种情况多数是磁头或者盘片出现了错误。联系专业的数据恢复公司,拆开硬盘, 果然是盘片出现了划伤,好在划伤面积并不大,更换磁头后重新恢复数据,恢复了95%以 上的数据,算是比较好的结果了。 这个故障发现的及时,在盘片没有出现更多物理损伤前予以解决,如盘片损坏严重,数 据将永久性丢失,为了避免这种状况的发生我们需要做到以下几点: 选择质量上乘的服务器硬盘,比如:平均无故障时间超过 1600000 小时,年故障率低 于0.55%,抗震方面要有300G/2ms 的以上的耐冲击能力等等; 关键服务器采用RAID 模式,比如:RAID5,它由至少3 块硬盘组成,在向硬盘写入 数据信息的同时,还写入校验信息,当其中有 1 块硬盘出现故障时,可以根据算法从另外2 块硬盘上得出这块故障硬盘的数据,安全性大大提高。 RAID 故障回放:某企业更换新的数据中心,服务器需要逐步迁移,一台文件服务器成为先行者。 这是一台采用的 RAID1 容灾策略的服务器,迁移过程中没有任何问题,但是使用不久一次 雷暴天气后服务器异常关闭,经检测防雷系统并没有起到应有的作用,导致服务器两块硬盘 同时损坏。 解决方案:对于RAID1 来说,只能允许一块硬盘的损坏,当2 块硬盘同时损坏后,数据将 全部丢失,对于 RAID3、5 来说同样如此;而对于RAID6,虽然支持两块硬盘同时掉线, 但是第三块盘再度掉线后,系统将也将全面崩溃! 上述故障数据将是不可逆性恢复,由此可见RAID 技术虽好,仍有一些弊端,因此对 于极其重要的服务器我们不仅仅要做出RAID 的策略,还要将核心数据同步备份到其他介 质,比如:磁带、磁盘等。 主板 故障回放:根据日志的记录,Wsus 服务器在凌晨2 点宕机了,回滚当日监控录像和环境 记录,没有任何异常,起初怀疑是病毒或者策略等软件因素造成的意外状况,但是重启服务 器时却是另外一番景象。 开机→风扇转动,电源模块指示灯狂闪→尚未自检,随即再次启动→电源模块指示灯再次闪 烁,如此周而复始。 解决方案:更换CPU、内存插槽,更换电源模块,插拔硬盘,故障依旧,将这些设备放置 到同型号的服务器上,没有任何问题。于是怀疑主板损坏,联系厂家工程师,经检测确实是 主板故障,更换主板后恢复正常。 同CPU 一样,主板的故障率是比较低的,但是它的危害程度却远高于CPU,对于多路 服务器来讲,单一CPU 的损坏并不会影响整个服务器的运转,我们失去的或许只是性能和 速度;而对于主板,它几乎没有替代品,只能依靠厂家的更换,因此它的危险性较高。 静电 防静电、雷击的UPS 已普及 故障回放:一间极为普通的机房内,春节过后,准备手动升级病毒库,刚刚触摸服务器,瞬 间一个电火花出现,紧接着服务器死机了,重新启动服务器很多数据莫名其妙的丢失。 解决方案:不要小看这电火花,当人体接触金属物质产生电火花时,人体的静电电压已经超 过3000 伏,而硬盘只需 1000 伏左右的静电就会造成数据丢失,因此防静电工作务必做 好,如今机房最为普遍、最为简便的防静电措施就是铺设防静电地板,它不仅能过滤很多的 静电,在防火、防潮、防锈方面也起到很大作用,保护效果非常明显。 另外,闪电、雷暴等自然灾害也会造成硬件的损坏,这要破坏要远远高于静电,所以保 护硬件安全也需要部署B/C 级防雷。 不明原因的故障 故障回放:有故障现象,无故障原因 解决方案:类似的事情有很多,比如说系统蓝屏,可能是软件冲突,也可能是病毒,还可能 是内存,亦有可能是主板电容爆掉……,面对这种故障我们很难第一时间与以判断,这个时 候我们就需要在综合的角度进行考量。 首先重装系统,排除软件的故障;然后,逐一替换系统硬件,排除硬件故障的可能性; 如问题依旧就需要考察服务器的应用环境是否正常,比如电力供应是否满足需求,温湿度是 否在正常指标之内,机房的洁净度是否合规,服务期内的灰尘是否太多等等。很多时候故障 出现的时间并不

文档评论(0)

duyingjie1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档