- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章、机房环境及物理检查
一、机房内环境要求
温度与湿度:
最正确工作温度: 20-25 摄氏度
极限工作温度: 10-40 摄氏度
湿度 : 8-80%( 在23摄氏度条件下 )
如果不是工作在最正确温度,请注意改良机房环境
同时机房要保证清洁 .
机房应保持清洁, 若空气尘埃过多, 很容易造成资源读写错误及磁盘机中磁盘或读写磁头毁损。
二、电源要求
电
压 :
要求电压稳定 ,
尖峰电压会破坏设施
电压范围 :
220V +/- 10%,
即200-240V, 50-60Hz
电源功率 :
视机器种类和系统配置而定
电源线 :
标准的零 , 地,
火三相电 , 其中零 , 地电压不得超过 3.0V.
电源接驳 :
用切合电流要求的空气开关或其他设施和主机电源线接驳
, 保证计算机系统
的可靠工作应使用稳压电源和 UPS,并建议配备发电机组 ; 关于冗于电源的接入 , 建议采用两路独自输入 .
三、硬件检查
检查服务器、磁阵的安装、电源线、 7133和主机接线切合要求。
服务器状态检查:
当服务器处于启动和正常工作状态时, 其前面板上的液晶显示屏上应无信息显示。
当液晶显示器上出现 带数字和字母的信息时, 说明有硬件告警。 能够通过查问有关机型的 Service Guide 查到相应告警原因,情况严重的,则要立刻通知 IBM 技术专家进行问题排查。
7133状态检查:
磁阵前面板上有 7133机柜的状态灯(与电源灯并排)和各硬盘的状态灯(一排小灯,与各硬盘位置一一对应)。
1. 当机柜的状态灯出现橙黄色时,说明有硬件告警 ,此时要检查磁柜的电源、接线、硬盘等。如果有硬件故障则立刻进行改换和改正,如果查不出详细问题,则需要联系有关专家进一步诊疗。
2. 当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮,
如该硬盘有读写操作,则绿灯会不规则闪烁, 当硬盘破坏时或 SSA 环路出现问题时,则硬盘状态灯将熄灭,或许呈闪烁状态:以 1~3 秒的频次有规律地、不停地闪烁
第二章、系统平时维护流程
2.1 系统启动
系统启动正常次序如下:
首先对外设(磁盘阵列、磁带库等)加电。
待所有外设加电自检达成后, 主机加电正常起机。 主机加电后 , 系统进行自检 , 在液晶显示屏显
示” ok”后 , 才能按白色 POWER键起机 .
启动主机 HACMP,启动后可用命令 tail -f /tmp/hacmp.out 来检查启动情况,在 HACMP未完全
启动前不要进行下一步。
检查服务器的网络地点,路由表 ( 可用 netstat -i , netstat -rn 等 ) ,检查文件系统,逻辑卷
( 可用 mount , lsvg -o 等 ) 。
检查各项应用是否工作正常。
2.2 系统封闭
停止 HACMP ( smitty clstop) 。
查察 HACMP的状态,检查服务器的网络地点,路由表 ( 可用 netstat -i , netstat -rn 等 ) ,
检查文件系统,逻辑卷 ( 可用 mount , lsvg -o 等 ) 。在 HACMP未完全停止前不要进行下一步。
封闭主机 (shutdown –F) 。重启系统能够使用: shutdown -Fr 如有必要的话,按磁盘阵列前方的白色按钮封闭磁盘阵列。
2.3 查察系统的错误记录
在系统运行时,一些系统错误会记录在 errlog 中,其中有些错误还会在终端上显示。检查错误日志可用以下命令:
#errpt|more 查察系统所有的记录
IDENTIFIER TIMESTAM P T C
RESOURCE_NAME DESCRIPTION
E85C5C4C
0426104399
P
S
CFGLFT
SOFTWARE PROGRAM ERROR
2BFA76F6
0426104099
T
S
SYSPROC
SYSTEM SHUTDOWN BY USER
9D4CF6E7
0426104399
T
O
errdemon
ERROR LOGGING TURNED ON
1E2AC07E
0426103999
T
O
errdemon
ERROR LOGGING TURNED OFF
1E5EER4T
0423132999
T
O
clstrmgr
OPERATOR NOTIFICATION
其中
IDENTIFIER 为错误编号,当需要检查详尽信息时常会用到。
TIME STAMP 为时间标签,它记录的是出错时间,其格式 : 月月日日时时分分年年
T 为 Type , 它记录的是错误种类
:为永远错误,需引起注意 T :为临时错误。
C 为 Class, 它记录的是错误种类,如
H : Hardware
S : Software
O :
文档评论(0)