机房类运维服务方案范例版.docx

  1. 1、本文档共238页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Word可编辑 机房类运维服务方案范例 十四、服务方案 一、机房及设备维护方案与计划 1、预防性检查 1.1 巡检时间 每个工作日上午9点 1.2、巡检地点 计算机机房、精密空调、UPS 1.3、巡检目的 进行机房检查,对机房设备及供电系统、UPS系统、精密空调系统、录像系统等设备进行检查,及时发现设备隐患,排除故障。 1.4、巡检要求 1.4. 1.巡检期间,进行状态检查,若发现问题,如计算机机房物理环境异常、精密空调异常、UPS及配电系统异常等,应按照应急预案及操作流程进行处理。 (1)电源、UPS:检查机房供电状况,UPS工作情况、指示状态。检查UPS蓄电池使用状态,确保蓄电池无松动。并使用温度枪进行检测物理温度。确保配电柜及UPS、蓄电池无温度过高现象。 (2)机房环境:检查机房卫生状况及物理环境。 (3)机房温度:检查温湿度,将温湿度控制在一定范围内。温度:22℃±5℃,湿度 ≤60%. (4)机房空调:空调运行状态、空调内部有无漏水现象、空调噪音、空调风量等。 (5)机房照明:机房照明系统是否正常,有无异常状况。 (6)机房PDU:PDU市电或UPS是否正常,使用温度枪进行检测外部物理温度。 (7)机房整体:检查机房其余设备运行状态,有无报警及指示灯异常状态。 1.4. 2.如果故障按恢复规程无法有效恢复,特别是当发生机房环境(动力、空调)故障、关键的设备、网络、系统、服务如无法及时恢复时,应立即通知甲方相关领导,由相关领导协调资源进行故障处理。 1.4.3.故障处理过程必须在机房日常巡检表的备注栏中详细记录,以备查阅。 1.5、计算机机房现场管理要求 1.除工作人员外,其他工作人员进出机房,需签字后方可进入,同时计算机机房人员要在现场,检查监督其人员工作,避免其他人员未经授权擅自接触机房物理设备。 2.机房的机柜、线缆、设备等的标签管理; 3.机房环境清理。 1.6每日检查内容列表 项目 性能检查内容 脆弱性检查内容 空调系统 高压压力、低压压力(风冷系统),冷冻水压力、温度,冷却水压力、温度(水冷系统),风机运行情况,滤网、内机排水系统、灰尘情况等。 机房热点情况、室内机漏水检查、室外风机运转情况、加湿罐阳极棒检查、过滤网检查等。 供配电系统 输入输出功率,输入输出电流、断路开关、接地电阻、零序电流、器件发热情况等。 导线、器件发热情况,断路开关、防浪涌器件情况等。 UPS系统 负载功率情况、器件发热情况、电池情况(外观、液位、接线柱)等。 器件、导线发热情况,电池放电时间等。 安全系统 录像备份管理、出入机房登记、器件灵敏度、画面清晰度(不同照度情况下)、云台运行等。 器件灵敏度、监控死角问题等。 设备运行 机房环境 查看设备运行指示灯、机房照明运行情况、机房环境 设备运行是否有报警情况、照明是否正常、机房卫生是否整洁等 2、现场故障维修 每日巡检过程中,如有发现设备及环境系统有故障状态,需进行记录并恢复故障状态。如不能立即恢复故障状态,则需进行应急预案处理。具体如下: 2.1 环境故障:卫生、温湿度、照明。(四级故障) 2.2 交换机故障:交换机蜂鸣,交换机启动不正常,指示灯异常。(三级故障) 2.3 空调故障:空调压缩机故障、空调冷凝水故障、空调漏水故障、空调制冷故障、空调加湿器故障等。(二级故障 2.4 UPS故障:UPS逆变故障、UPS旁路、UPS蓄电池温度、UPS蓄电池外观鼓包现象、UPS蜂鸣报警等(一级故障) 2.5 配电柜故障:配电柜内温度过高、配电柜打火现象等。(一级故障) 在解决故障时,最大限度做好故障恢复的文档,力争恢复到故障点前的业务状态。对于“系统瘫痪,业务系统不能运转”的故障级别,如果不能于30分钟内解决故障,应立即提出应急方案,确保业务系统的运行。故障解决后24小时内,提交故障处理报告。说明故障种类、故障原因、故障解决中使用的方法及故障损失等情况。故障类型、级别及相应标准列表: 故障级别 响应时间 故障解决时间 I级:属于紧急问题;其具体现象为:机房出现电力事故等意外情况导致业务停止、UPS系统崩溃导致业务停止、空调系统崩溃导致业务停止。 电话立即响应,5分钟内人员抵达现场,30分钟内恢复业务使用,2小时内提交故障处理方案。 12小时以内 II级:属于严重问题;其具体现象为: 出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。 电话立即响应,5分钟内抵达现场,1小时内提交故障处理方案 24小时以内 III级:属于较严重问题;其具体现象为:出现系统报错或警告,但业务系统能继续运行且性能不受影响。 电话立即响应,5分钟内抵达现场,2小时内提交故障处理方案 48小时以内 IV级:属于普通问题;其具体现象为:系统技术功能、安装或配置咨询。

文档评论(0)

Kaiser + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档