WP217_R0_如何准备和响应数据中心的紧急情况WP217_R0_如何准备和响应数据中心的紧急情况.pdf

WP217_R0_如何准备和响应数据中心的紧急情况WP217_R0_如何准备和响应数据中心的紧急情况.pdf

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
WP217_R0_如何准备和响应数据中心的紧急情况WP217_R0_如何准备和响应数据中心的紧急情况

如何准备和响应数据中心的紧急情况 第 217 号白皮书 版本 0 作者 Leonid Shishlov Mark Rentzke 张永萍 Patrick Donovan 摘要 数据中心运行和维护团队应该始终处于临战状态, 能在没有预警的情况下快速并有信心地行动。不可 预见的问题、故障和危险可能会导致伤害或者停 机。然而,良好的准备和过程能够快速和安全地减 轻紧急情况的影响,并有助于防止他们的再次发 生。本白皮书介绍了一个针对使命关键的设施的有 效的应急准备和应急响应策略的框架。这一策略由 以下三大类的七个要素组成:应急响应程序、应急 演练、和突发事件管理。本文介绍了每一个要素并 提供了实用的建议来帮助实施这一策略。 施耐德电气 – 数据中心科研中心 第 229 号白皮书 版本 0 2 简介 正如在第 196 号白皮书, 《数据中心基础设施运营的关键要素》,中所说的,即使是 一个专家设计和建造的、经过完全调试的 Tier IV 级认证的数据中心也不能保证 100% 的可用性。 由于 IT 系统计划外的停机造成业务中断始终是一个风险。良好的准备是最 好的防御,并将有助于确保及时、高效和无差错的响应。准备工作开始于为所有已经识 别的高风险故障情景编写紧急操作程序(EOP),例如冷水机站组站的丧失、发电机组 启动失败等等。升级上报程序也需要编写并演习来确保通知到整个指挥链,并随着形势 “即使是一个专家设计和建 的发展调遣合适的资源来应对。情景演练应该定期进行来演习和评估整个团队和团队中 造、经过完全调试的 Tier IV 的每一个人的应急响应的有效性。一旦一次意外事件得到了处理并且其影响得到了减 级认证的数据中心也不能保证 轻,就应该要进行一次分析来了解其根本原因是什么,以及在处理这个问题的过程中的 100%的可用性。” 应急响应是多么有效。对重大的设施事件正式的故障分析是整体持续改进过程的一个基 本组成部分,我们需要整体持续改进过程来减少故障和改进将来的事件响应的有效性。 表 1 给出了数据中心有效的应急准备和应急响应计划的各关键方面的简短说明。总共有 7 个要素,分别归属于 3 个更高一级的类别。 类别 要素 简短介绍 紧急操作程序提供了一个安全地隔离故障并 紧急操作程序 恢复服务或者恢复冗余的行动计划。 一个在危机情况下要做什么的详细的一步一 危机管理计划 应急响应程序 步的行动计划。 升级上报程序是一份文件化的、带有优先级 升级上报程序 的联络人名单,它列出了与数据中心运营相 表 1 关的各种具体情况的内部联络要求。 数据中心应急准备和 应急响应策略的概述 应急演练 应急演练 对已经识别出的最重要的 10 个运营风险安

您可能关注的文档

文档评论(0)

pfenejiarz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档