云平台服务器存储应急的方案.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
云平台服务器存储 应急预案 目录 1 目的 ................................................. 错误 !未定义书签。 2 适用范围 ............................................. 错误 !未定义书签。 3 规范内容 ............................................. 错误 !未定义书签。 故障分类 ...................................... 错误 !未定义书签。 应急准备 ...................................... 错误 !未定义书签。 具体措施 ...................................... 错误 !未定义书签。 4 故障处理规范 ......................................... 错误 !未定义书签。 机房停电 ...................................... 错误 !未定义书签。 主机故障 ...................................... 错误 !未定义书签。 存储系统故障 .................................. 错误 !未定义书签。 云平台软件系统故障 ............................ 错误 !未定义书签。 云平台管理服务器故障预防 ......................错误 !未定义书签。 云平台日常告警故障排除 ........................ 错误 !未定义书签。 5 硬件故障预防与排除 ................................... 错误 !未定义书签。 故障预防 ...................................... 错误 !未定义书签。 故障排除 ...................................... 错误 !未定义书签。 故障处理 ...................................... 错误 !未定义书签。 1 目的 为提高云平台服务器、存储故障处理能力,形成科学、有效、反应迅速的日常管理流程和应急处理机制, 确保平台的安全和稳定运行, 最大限度地减小故障对生产的影响,降低业务中断风险,特制定本规范。 2 适用范围 本规范适用于提供云计算虚拟化平台服务的服务器、 存储管理,应对发生和 可能发生的故障。 3 规范内容 服务器运维和应急处理应包括风险评估, 检测体系和应急处理三个环节, 合 理有效的执行控制将防止故障影响扩大。 3.1 故障分类 平台故障包括服务器硬件和存储系统故障;自然灾害(水、火、电等)造成 的物理破坏;人为误操作造成的损害等。 3.2 应急准备 部门责任人员明确职责和管理范围, 根据实际情况, 安排应急值班, 确保到 岗到人,联络畅通,处理及时准确。 3.3 具体措施 (1) 建立安全、可靠、稳定运行的机房环境,防火、防雷电、防水、防静电、防尘;建立备份电源系统。 (2) 虚拟化平台服务器应采用可靠、稳定、兼容性硬件,落实责任管理机制,遵守安全操作规范; 对虚拟机和管理服务器进行定时备份; 采用有效的虚拟化监控工具,及时发现问题和日报告。 4 故障处理规范 4.1 机房停电 接到停电通知后,相关人员应及时部署应对具体措施,启动备用电源 , 保证 服务器正常运行。 4.2 主机故障 (1) 平台服务器出现硬件告警需要停机维护, 服务器责任人应立即通知相关人员,将业务虚机迁移到集群中其他服务器主机上, 再将故障服务器切换至维护模式并从 HA集群中移除,负责陪同硬件厂家现场更换至成功恢复。 (2) 若服务器硬件 24 小时内无法恢复,服务器责任人需书面报告原因并立即通知业务管理人员进行数据应急备份 , 防止灾难扩大。 (3)若虚拟化存储硬件出现告警,第一目击人应立即通知存储管理员,并 上报主管领导, 存储管理员应在报告 1 小时内联系厂家到场处理, 处理完成后因报告原因,找到解决方法;并立即对数据做完整性检查,消除重复发生隐患。 4.3 存储系统故障 (1)做好存储系统的定时备份,一旦出现数据损坏、丢失,能够及时恢复系统。 (2)发生存储系统故障后,相关人员应检查出现故障的原因并尽快排除。 (3)如遇系统崩溃,数据丢失,应启用备份文件进行数据恢复。 4.4 云平台软件系统故障 (1)日常做好虚拟机的定时备份和快照,系统崩溃后,能够及时恢复虚拟 机。 (2)发生虚拟机系统故障后,相关人员应及时通知业务

文档评论(0)

135****9492 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档