- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
LOGO
LOGO
LOGO
LOGO
XX公司服务器硬件应急预案
2020年6月
目录
一、应急背景与范围 4
1、应急预案背景 4
2、预案适用范围与数量 4
二、预案启动条件 4
1、预警分级 4
2、响应分级与启动标准 4
三、方案执行原则 5
1、故障及时反馈 5
2、统一领导 5
3、多人协同 5
4、硬件故障恢复优先 5
5、故障回顾 5
四、应级保障分工界面 5
1、应急小组成员 5
2、职责与分工界面 6
3、预案处理流程 7
五、服务器硬件现状 7
六、故障原因及结果分析 7
1、服务器批量宕机 7
2、服务器硬件故障 7
七、预防保障措施 7
1、开展日常检查和月度巡检 7
2、日常检查内容 8
八、应急资源配备...................................................................................
一、应急背景与范围
1、应急预案背景
XX公司服务器硬件应急预案泛指XX公司机房地址,202机房、203机房、204机房(华为合营云)内的服务器设备硬件故障导致业务中断或业务受到影响时,按预警分级启动本预案并按本方案进行人员角色组织或转换进行对故障问题分析、结果预测、故障处理方案等保障性工作和业务恢复。
2、预案适用范围与数量
本方案涉及9.2期后续服务器设备,目前9.2期XX公司服务器总共1140台;其中烽火F1200V560台,华三R4900120台,R690072台,浪潮NF5466M5140
台,NF8460M58台,曙光H320100台,H320G30230台,中兴R5300G430台,
R5300G4280台,R5500G4100台。服务器均采用双路电源具有高可用冗余,业务系统具有备份节点。服务器硬件(包括cpu\内存\电源\光模块\硬盘等)厂商包括不限于;浪潮、中兴、曙光、峰火、华三等。
二、预案启动条件
1、预警分级
按影响范围,将通信预警划分为特别严重(Ⅰ级)、严重(Ⅱ级)、较严重(Ⅲ级)和一般(Ⅳ级)四个等级,依次标为红色、橙色、黄色和蓝色:Ⅰ级(红色):业务核心全断,出口网络(国干,省干)全部中断。Ⅱ级(橙色):出口网络国干或省干中断,IP承载网中断,AZ互联链路中断,核心HA设备中断。
Ⅲ级(黄色):出口,AZ互联,IP承载网主备链路中断一条,接入HA设备一起中断。Ⅳ级(蓝色):机房内接入或者汇聚设备主备中断一台或者主备链路中断一条。
LOGO
LOGO
LOGO
LOGO
故障恢复后,需要分析故障原因,评估损失,提出改进建议。
故障恢复后,需要分析故障原因,评估损失,提出改进建议。
发生特殊情况,可结合实际,适当调整预警相应级别。
2、响应分级与启动标准
如发生Ⅰ级(红色)事件,且影响虚机业务超过50%,启动Ⅰ级响应,如发生Ⅱ级(橙色)事件,且影响虚机业务超过50%,启动Ⅱ级响应如发生Ⅱ级(橙色)事件,且影响虚机业务超过20%,启级Ⅲ响应
如发生Ⅲ级(黄色)事件,且影响虚机业务超过20%,启动Ⅲ级响应如发生Ⅲ级(黄色)事件,且影响虚机业务超过10%,启动Ⅳ级响应,如发生Ⅳ级(蓝色)事件,启动Ⅳ级响应。
三、方案执行原则
1、故障及时反馈
出现故障后,根据故障持续时间和故障严重程度,通知不同上级。
2、统一领导
出现故障后,需要有人统筹整体处理进度,合理分工,确保各部门密切合作,快速响应。
3、多人协同
出现故障后,原因不确认的情况下,需要同时协调多部门人员包括厂商人员一起推进故障处理。
4、硬件故障恢复优先
在出现故障后,若是故障短时间无法解决,可通过其他方案临时恢复业务,优先保证金银牌客户业务恢复,恢复业务后再解决故障。
5、故障回顾
四、应级保障分工界面
1、应急小组成员
2、职责与分工界面
省公司接口人:于杭、周远
负责统一指挥作战,负责协助协调备用服务器硬件资源,包括不限于板卡、cpu、内存、存储硬盘、电源等硬件设备。
现场组长:吴杰
负责现场牵头应急预案工作开展,故障通报上级领导和云能力中心,主导现场硬件故障处理,结果分析、故障原因分析,协助备件协调等。
服务器工程师:欧阳为丁鹏飞
负责现场服务器故障定位排查、故障处理、服务器硬件更换、预期坏结果和业务影响分析、事故原因追溯。
备件调度员:邹志明吴杰
LOGO
LOGO
LOGO
LOGO
负责服务器备件准备
您可能关注的文档
- 风险管理知识.docx
- 风险管理总结.docx
- 风衣腰带系法.docx
- 风油精的特殊新用.docx
- 风油精特殊新用.docx
- 风雨分析和总结.docx
- 风云语录分析和总结.docx
- 蜂胶软胶囊分析和总结.docx
- 蜂蜡的美容作用与功效.docx
- 蜂蜜百科分析和总结.docx
- 类型电影参照性互文与民族心理契合——以<战狼2>为例传播学.pdf
- 第7单元青少年自主选择衣物探讨.pdf
- 平均场Boltzmann机在高分辨率Kirchhoff偏移中应用研究.pdf
- VI Launcher LabVIEW工具集用户指南.pdf
- Tiger4.0日志抓取方法与设置指南.pdf
- 1945-1979年阿以冲突历史考题及分析.pdf
- 多视图调度中非对称纳什讨价还价方法.pdf
- FFmpeg与FFServer配合实现高效实时流媒体服务.pdf
- EN Setup Manager 2.7安装指南与前提条件.pdf
- 2025-2026学年甘肃省兰州十九中教育集团片区八年级(上)期末道德与法治试卷(含答案).docx
原创力文档


文档评论(0)