(系统出现宕机的解决方案.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(系统出现宕机的解决方案

HPIntegrity,9000服务器-如何处理;问题;如何处理HP服务器系统宕机的故障;解决方案; 系统宕机,分为几种情况:1.系统不能启动 机器宕掉后重新加电可以启动 系统自己重启。相比第一种情况,后两种情况处理起来容易一些。机器不能启动时,先检查启动停在了什么位置。从时间顺序分为:不能加电;加电后自检失败,不能进入BCH或者EFI;可以进入BCH或者EFI,但是不能启动系统。1) 不能加电按power钮没有反应,或者是按完power钮听到风扇转动但是马上又停掉。这种情况,在MP卡里用PS命令查看机器状态,看看是不是有某些备件出了问题。比如BPS、FAN、CELL、SYSBoard等等。并且检查机器各个指示灯的状态(前后都要看),看看有哪个灯是黄、红或者不亮。检查MP日志,分析值得怀疑的问题。如果前两项工作不能确定问题,就做最小化测试。cpu、memory、bps、板卡。最坏的结果可能是做了最小化测试也不能确定出是什么备件的问题。这项工作最好交给HP响应中心的工程师处理。2. 加电后自检失败,不能进入BCH或者EFI。1. 注意观查自检是停到什么地方的,或者是自检到什么位置后又自动重启了。 例如,自检反复进行,到CPU自检时就重启了。通过记录console日志,来找到自检反复进行的规律。反正机器已经不能用了,要是看不清楚就停掉它,然后重新启动,这样你会看到非常清晰的过程日志。然后记住自检的第一条是什么,再找到下一条相同的信息,它前面的就是重启前的信息了。2. 检查MP日志,如果报错信息能和自检停止的设备对应上,那问题就诊断出来了。如果不能对应,就要具体分析两者之间的关系。例如,自检在CPU处重启了,而MP报的是I/O的错误。那很有可能是CPU的自检已经结果了,而I/O的自检不能开始。这样也可以判断出是I/O出现的问题。通常情况下,MP日志会报出具体出错的备件。换了再说!3. 如果不能确定问题,还是要做最小化测试。但是最小化测试也要有目的性。不能和前面提到的供电问题等同。通过自检和MP日志,首先要确定一个大方向,比如怀疑可能是CPU,也或者是内存,也可能是I/O和CPU。这时候做最小化测试是可以进入BCH或者是EFI的。这种情况下,把怀疑的备件一个一个的加回来,直到问题又出现,这样故障点就找到了。之所以要确定大方向,就是要在最小化成功后,尽快的把问题备件找到。3. 可以进入BCH或者EFI,但是不能启动系统。这种情况,可能是软件,也可能是硬件问题导致的,处理起来,稍复杂一些。我们以根有mirror为例。1. 如果两条引导路径都找不到那就可能是I/O的硬件问题了。用SEA(PA)或者是MAP(IA)来查看所有的硬盘的路径。如果找不到了,那肯定是硬件问题。如果可以找到,但是和配置信息中的引导路径不同。可能是用户自己修改了引导路径,也或者是由于硬件问题导致路径地址发生变化。这时请检查block图。如果引导硬盘的槽位地址和block中的地址不同,那么考虑scsi链路的硬件问题(disk midplane,core i/o都可能有问题,corei/o的可能性很大)。如果硬盘地址和block相同,而配置引导路径不同,那么显然是配置错误,修改好它就可以。2. 如果有一条引导路径找不到看看从另外的路径上能不能启动。如果另外的路径能启动,那么就是找不到路径的这块盘有问题,或者是disk midplane有问题。做个交叉测试,确定是硬盘的问题还是disk midplane的问题。3. 如果两条路径都可以找到分别从不同的路径引导。如果其中一个可以成功,用交叉测试的办法来确定是硬盘还是disk midplane问题。如果两条路径都不能启动,那么通常报错会是一样的。可能的原因是i/o硬件问题、软件问题。i/o硬件问题拔掉所有的外设后重启。如果拔掉外设后启动成功,就要定位是哪一个外设引起的。经常出现的情况是,scsi设备或者是光纤设备有问题。如果还不能启动,做最小化测试。这种最小化测试,范围定在与i/o有关的设备就可以了。例如,core i/o、板卡等。 软件问题通常有几种情况:内核文件问题、文件系统问题、系统数据问题。 内核文件问题,问清楚用户之前做过什么操作并尝试从备份内核启动。如果失败,尝试用光盘恢复内核。最后的办法就是备份带恢复。 文件系统问题,会在启动时报出详细的错误,比如某个文件系统满、文件系统检查失败,文件系统丢失等等。这种情况下,进入单用户状态去解决。需要注意的事,如果是文件系统检查失败,不要轻易做fsck -o full操作。如果是/usr这种比较重要的文件系统,可以尝试用只读方式mount,赢得备份机会。例如,由于/usr文件系统自检失败,导致系统不能启动。这时首先进入单用户,用mount -o ro把/usr挂载上。用剩余空间新建

文档评论(0)

tt859685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档