产品经理标准化数据备份及恢复操作手册.docVIP

产品经理标准化数据备份及恢复操作手册.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

产品经理原则化数据备份及恢复操作手册

目的

产品经理必须具有软件系统数据备份及系统恢复的操作能力,保障软件产品安全稳定运行,客户使用企业软件产品时可以安全、有序、健康、高效地开展工作,防止紧急突发事件、及时排查和迅速处理故障。

规定及约束

为了实现以上目的,需要多种内、外部环境和设施:

需要所有有关人员统一思想、统一认识,积极积极参与系统的建设和维护中来。形成严格的问题反馈机制。

形成高效的应急领导小组,项目经理责任制,组长把关,职责到人明确分工,在工作中管理得当、到位。实行人员工作认真、负责,规范化、流程化工作,如有原则操作手册一定要严格执行。遵守现场规定的多种系统集成、系统维护、数据库维护工作规范等。

建立高效的协调机制,由于该系统会集成其他厂家系统或数据中心数据,有关接口规定明确、沟通流畅,防止通道阻塞。其他如数据库、中间件、系统配置有关软件厂家和供应商要有交流渠道,一旦发现问题立即处理。

需要提供良好的办公环境,为集中处理问题提供便利。

需要定期召开协调会议,通报系统建设状况和存在问题。

组织机构与职责

产品经理牵头组织成立的运行应急处理组织机构一般应包括平常维护监控组、应急指挥中心、应急工作组,应急工作组包括程序故障应急小组、应用故障应急小组、平台故障应急小组、网络故障应急小组、后勤保障应急小组。

应急指挥中心

应急指挥中心由应急组长、项目经理、项目管控领导等构成。

企业应急指挥中心的重要职责:

(1)审定软件系统优化提高时系统的运行应急预案;

(2)宣布进入和解除应急状态,决定实行和终止软件优化提高上线、上线运行应急预案;

(3)对系统突发事件级别进行决策,并统一指挥应急处置工作;

(4)研究讨论突发事件的产生原因、处理过程、处理成果,并公布处理措施进行确认归档。

应急工作组

应急工作组按职能角色分类,应当由软件开发负责人、软件工程师,网络工程师,实行工程师,系统集成工程师,测试工程师等构成。

应急工作小组在系统应急突发事件中的重要职责:

(1)贯彻应急指挥中心布署的各项任务;

(2)负责企业软件应急预案的编制工作;

(3)监督执行应急指挥中心下达的应急指令、重大应急决策和布署,协调各方应急资源,组织各单位及故障处理小组进行应急处理;

(4)及时理解和掌握系统突发事件与应急处置工作状况,向应急指挥中心汇报应急处置过程中发现的重大问题,并协调处理;

(5)负责系统突发事件调查、总结应急处理经验和教训等后期处置工作。

(6)人员分工详见《应急组织及人员分工表》。

事件分级

软件故障对服务的顾客和企业生产、经营和管理的影响范围、程度、也许产生的后果和损失等原因,将系统故障分为重大事件(I级)、较大事件(II级)和一般事件(III级)三个等级。

发生一般事件(III级)企业及时规定进入系统应用III级应急状态,发生II级突发事件企业进入II级应急状态,发生I级系统突发事件企业进入I级应急状态。

重大事件

重大事件是指上线运行过程中,整个系统或功能模块无法运行,且持续6个小时无法恢复,严重损害客户的利益的突发事件;或者系统运行过程中的关键业务出现严重错误,对企业正常运行和监测导致严重影响和巨大经济损失的突发事件;或者网络故障导致大面积顾客服务中断的突发事件。

软件出现重大事件重要有:

应用系统宕机,导致系统无法使用和正常运转。

在IMS监控中出现数据断连状况,影响数据正常传递。

数据库中数据丢失,给客户带来重大损失、影响正常监测。

较大事件

较大事件是指割接过程中或上线运行过程中,整个系统或功能模块可以运行,不过性能大幅下降,且持续6个小时无法恢复,一定程度上损害客户利益的突发事件;或者系统运行过程中的关键业务出现较大错误,对运行监测导致较大影响和较大经济损失的突发事件;或者网络故障导致部分顾客服务中断的突发事件。

软件出现较大事件重要有:

流程无法上传下达。

无法监控项目信息异动。

一般事件

一般事件是指割接过程中或上线运行过程中,整个系统或功能模块运行正常,关键业务运行正常,不过性能有一定程度的下降;或者非关键业务可以开展,不过存在某些问题,对正常运行监测导致较小影响的突发事件;或者网络故障导致少许顾客服务中断的突发事件。

系统页面报错发生异常。

顾客信息锁死,登录异常。

系统运行缓慢,影响客户正常使用。

监控异常,指标异常,阀值异常。

部分功能模块报错无法使用。

网络连接出现异常,包括客户无法登录、数据无法传递等。

应急响应机制

因下列原因对系统上线或上线运行导致尤其严重影响,也许影响客户正常使用和其他工作停滞。

(1)通道与网络故障;

(2)主机设备、操作系统、中间件和数据库软件故障;

(3)应用服务故障;

(4)应用程序公布故障或应用系统数据丢失;

(5)数据传播、接受重大错误;

(8)机房电

文档评论(0)

精致文档 + 关注
实名认证
文档贡献者

精致文档

1亿VIP精品文档

相关文档