信息化设备维护除尘服务应急预案.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE PAGE 2 PAGE PAGE 1 目 录 TOC \o 1-3 \h \z \u 27884 一、目的 4 18343 二、使用范围 4 28268 三、除尘服务参与人员 7 30960 四、预防机制 7 12770 五、应急响应措施 11 28026 六、实施计划 13 一、目的 根据要求和与客户的沟通结果,将于 年 月份完成每年一次除尘服务。此次除尘服务主要涉及到系统部门的设备包括服务器和存储。此次方案主要根据不同类型的设备的不同处理方式进行编写。 通过除尘服务可以提高设备散热性能,减少短路、磨损、静电等危害,大大延长了设备使用寿命。 为了提高应对服务过程中机房突发事件的处置能力,迅速有效地开展应急处置工作,降低危害程度,结合系统部门机房的特点,编制本预案。 二、使用范围 本方案主要使用于 年度信息化设备除尘服务,设备范围包括合同范围内维保设备。设备信息如下: 设备型号 设备类别 系统(主机)名称 IP地址 操作系统名称 运行业务系统 备注 IBM X3550 PC服务器 windows server 2003 中心机房 三、除尘服务参与人员 乙方除尘服务人员包括驻场工程师:Xx(负责)、xx、xx、xx Xx:1000000 xx:100000 xxx: 甲方技术接口人员:xx 四、预防机制 此次除尘服务主要是对设备内部和外部进行清理。 内部清理步骤:主要方式是设备断电后,机箱开盖,佩戴专业防静电装备,对设备易于吸附灰尘位置进行清理。使用专业毛刷、皮老虎等工具对空插槽、出风口、风扇、挡板等位置进行清理。 清理后,通电开机,保证系统正常使用,除尘结束。 需要内部清理的设备如下表(此类设备需要等业务停止后进行服务): 设备型号 设备类别 系统(主机)名称 IP地址 操作系统名称 运行业务系统 备注 外部清理步骤:对于无法断电又或者无法开盖的设备,对设备表面进行灰尘处理。使用专业毛刷、抹布等工具对设备表面进行擦拭。 需要外部清理的设备如下表: 设备型号 设备类别 系统(主机)名称 IP地址 操作系统名称 运行业务系统 备注 除尘过程中难免会有风险,特别是内部清理过程中,设备配件老旧、操作不当、静电损坏等。为了避免或降低此类风险的发生。我们主要通过一下方案进行操作。 针对独立运行的服务器 第一步、需要在业务停止后进操作系统执行关机,关机完毕后断开服务器电源、网络线和其他相关连接线。 第二步、工程师进行服务器下架,然后放置指定位置进行除尘。 第三步、除尘完毕后,服务器组装上架,连接网线、配置线和电源线,最后通电开机。 针对群集双机运行服务器 第一步、先将群集资源切换到备机上运行,若群集资源无法切换,停止操作,待问题解决后再进行重新操作。 第二步、切换完后,将主机系统进行关机,断电后将服务器下架,在指定位置进行除尘。 第三步、除尘完毕后,服务器组装上架,连接网线、配置线和电源线,最后通电开机。 第四步、正常开机后,将备机上的群集资源手动切换到主机上,对备机重复以上操作。 五、应急响应措施 1.服务前检查 做服务前先检查硬件设备,是否有报错,若出现硬件报错,停止除尘服务,先进行设备运维流程。 故障排除损件更换备件到场设备报修故障判断 故障排除 损件更换 备件到场 设备报修 故障判断 2.服务后故障等级 主要的设备故障应集中在除尘完成后,设备是否能正常开机启动。根据设备故障情况主要分为三个等级。 故障等级 故障现象 重大故障 硬件损坏或者软件损坏导致客户业务24小时或以上无法使用 严重故障 硬件损坏导致客户业务12小时内无法正常使用 一般故障 其他硬件或软件故障,2小时内无法正常使用 3.主要的应急措施 针对以上故障等级,主要的设备排错流程图如下: 故障发 故障发生 故障数据采集 故障数据采集 经验判断和理论分析、列出各种可能原因并优先排序 经验判断和理论分析、列出各种可能原因并优先排序 否 否 对每种原因实施排错 对每种原因实施排错 故障排错判定 故障排错判定 是 是 编写故障文档 编写故障文档 结束 结束 针对三级故障等级,我们采取了相对应的应急措施: 应急措施 措施内容 重大故障措施 硬件损坏或者软件损坏严重的情况下,及时通知故障发起点,并立即向主管领导汇报,取得乙方2线或1.5线技术支持,进入运维流程更换备件,争取24小时内解决设备故障,在相关故障排除后24小时内提交故障分析报告。 严重故障措施 硬件损坏的情况下,立即向主管领导汇报,进入运维流程更换备件,更换12小时内解决设备故障,并事后提交故障分析报告。 一般故障措施 一般故障当场解决,并事后提交故障分析报告。 六、实施计划 针对不同处理方案

文档评论(0)

138****7331 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档