IBMP系列小型机维护环境日常维护流程4018.docx

IBMP系列小型机维护环境日常维护流程4018.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章、机房环境及物理检查 一、机房内环境要求 温度与湿度: 最正确工作温度: 20-25 摄氏度 极限工作温度: 10-40 摄氏度 湿度 : 8-80%( 在23摄氏度条件下 ) 如果不是工作在最正确温度,请注意改良机房环境 同时机房要保证清洁 . 机房应保持清洁, 若空气尘埃过多, 很容易造成资源读写错误及磁盘机中磁盘或读写磁头毁损。 二、电源要求 电 压 : 要求电压稳定 , 尖峰电压会破坏设施 电压范围 : 220V +/- 10%, 即200-240V, 50-60Hz 电源功率 : 视机器种类和系统配置而定 电源线 : 标准的零 , 地, 火三相电 , 其中零 , 地电压不得超过 3.0V. 电源接驳 : 用切合电流要求的空气开关或其他设施和主机电源线接驳 , 保证计算机系统 的可靠工作应使用稳压电源和 UPS,并建议配备发电机组 ; 关于冗于电源的接入 , 建议采用两路独自输入 . 三、硬件检查 检查服务器、磁阵的安装、电源线、 7133和主机接线切合要求。 服务器状态检查: 当服务器处于启动和正常工作状态时, 其前面板上的液晶显示屏上应无信息显示。 当液晶显示器上出现 带数字和字母的信息时, 说明有硬件告警。 能够通过查问有关机型的 Service Guide 查到相应告警原因,情况严重的,则要立刻通知 IBM 技术专家进行问题排查。 7133状态检查: 磁阵前面板上有 7133机柜的状态灯(与电源灯并排)和各硬盘的状态灯(一排小灯,与各硬盘位置一一对应)。 1. 当机柜的状态灯出现橙黄色时,说明有硬件告警 ,此时要检查磁柜的电源、接线、硬盘等。如果有硬件故障则立刻进行改换和改正,如果查不出详细问题,则需要联系有关专家进一步诊疗。 2. 当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮, 如该硬盘有读写操作,则绿灯会不规则闪烁, 当硬盘破坏时或 SSA 环路出现问题时,则硬盘状态灯将熄灭,或许呈闪烁状态:以 1~3 秒的频次有规律地、不停地闪烁 第二章、系统平时维护流程 2.1 系统启动 系统启动正常次序如下: 首先对外设(磁盘阵列、磁带库等)加电。 待所有外设加电自检达成后, 主机加电正常起机。 主机加电后 , 系统进行自检 , 在液晶显示屏显 示” ok”后 , 才能按白色 POWER键起机 . 启动主机 HACMP,启动后可用命令 tail -f /tmp/hacmp.out 来检查启动情况,在 HACMP未完全 启动前不要进行下一步。 检查服务器的网络地点,路由表 ( 可用 netstat -i , netstat -rn 等 ) ,检查文件系统,逻辑卷 ( 可用 mount , lsvg -o 等 ) 。 检查各项应用是否工作正常。 2.2 系统封闭 停止 HACMP ( smitty clstop) 。 查察 HACMP的状态,检查服务器的网络地点,路由表 ( 可用 netstat -i , netstat -rn 等 ) , 检查文件系统,逻辑卷 ( 可用 mount , lsvg -o 等 ) 。在 HACMP未完全停止前不要进行下一步。 封闭主机 (shutdown –F) 。重启系统能够使用: shutdown -Fr 如有必要的话,按磁盘阵列前方的白色按钮封闭磁盘阵列。 2.3 查察系统的错误记录 在系统运行时,一些系统错误会记录在 errlog 中,其中有些错误还会在终端上显示。检查错误日志可用以下命令: #errpt|more 查察系统所有的记录 IDENTIFIER TIMESTAM P T C RESOURCE_NAME DESCRIPTION E85C5C4C 0426104399 P S CFGLFT SOFTWARE PROGRAM ERROR 2BFA76F6 0426104099 T S SYSPROC SYSTEM SHUTDOWN BY USER 9D4CF6E7 0426104399 T O errdemon ERROR LOGGING TURNED ON 1E2AC07E 0426103999 T O errdemon ERROR LOGGING TURNED OFF 1E5EER4T 0423132999 T O clstrmgr OPERATOR NOTIFICATION 其中 IDENTIFIER 为错误编号,当需要检查详尽信息时常会用到。 TIME STAMP 为时间标签,它记录的是出错时间,其格式 : 月月日日时时分分年年 T 为 Type , 它记录的是错误种类 :为永远错误,需引起注意 T :为临时错误。 C 为 Class, 它记录的是错误种类,如 H : Hardware S : Software O :

文档评论(0)

182****7876 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档