- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
WORD格式可编辑
专业知识分享
故障响应机制
北京傻+逼信息技术有限公司
2014年12月
目 录
TOC \o 1-3 \h \z \u 1 引言 1
1.1 编写目的 1
1.2 适用范围 1
2 故障 2
2.1 故障分类 2
2.2 故障响应时间表 4
3 故障定级 5
3.1 故障累积升级 5
3.2 处理能力不足 5
3.3 客户关注程度 5
3.4 客户反馈故障升级 6
3.5 客户监控出现的问题 6
3.6 故障定级矩阵 7
4 现场人员注意事项 8
5 故障响应人员 9
6 处理流程 10
6.1 一级故障 10
6.2 二级故障 11
6.3 三级故障 13
6.4 四级故障 14
7 事后总结 16
引言
编写目的
由于生产环境中经常会出现各种故障,一般通过两种途径:公司方人员发现、银行方人员告知。现场人员会发现问题不知道如何解决,也不知道该通知谁解决,经常会出现处理延误、沟通不畅等问题,导致客户满意度下降,客户信任度下降。
另外现场人员要加强自身的沟通能力,第一要安抚客户、告知客户公司已经进行处理,第二要能简明扼要的说明现场情况、客户关注程度、问题导致结果等。
本文档旨在提供一个规范化的流程,让现场人员做到有章可循,针对不同的故障级别找到响应的处理人员。
从故障处理上,不仅可以体现公司的专业性,也能提高客户满意度。
适用范围
项目组的所有人员需要了解,在故障出现的时候能第一时间进行处理。
领导组需要进行了解,知道各种级别的领导需要沟通。
故障
故障分类
故障按照产生的后果进行分类,共分为四类。
故障等级
故障说明
响应时间
处理时间
一级
一级故障:客户端无法使用,影响用户正常使用。
当系统出现下列相当严重的现象时,属一级故障:
?? 系统后台服务器整体瘫痪,全部操作失去响应;
?? 客户端(安卓、iPhone、iPad等仅一种出现)崩溃、无法进入用户界面;
?? 发生间歇性、随机性、重复性的启动或应用退出,无法保障客户业务的正常处理。
?? 两个二级故障及以上,升级为一级故障
≤2小时
≤1天
二级
二级故障:客户端整体可以使用,部分出现问题,影响用户的部分业务处理。
当系统出现下列比较严重的现象时,属二级故障:
?? 系统后台出现了部分问题,导致用户使用出现问题;
?? 客户端(安卓、iPhone、iPad等仅一种出现)部分功能失效,影响用户使用;
?? 系统整体性能严重下降,无法自动恢复正常运行状态;
?? 重要数据、参数和配置信息损坏,无法恢复,导致客户数据及业务记录严重损失;
?? 三个三级故障及以上,升级为二级故障
≤3小时
≤2天
三级
三级故障:客户端可以使用,出现的问题对用户的业务处理影响不大。
当系统出现下列现象时,属三级故障:
?? 服务器端软件或者硬件出现异常,局部功能受限,系统整体仍可正常工作,对客户业务影响不大或存在隐患;
?? 关键备用设施因故障离线,主用设施仍能正常工作;
? 后台日志发现有系统出现问题的趋势,或者已经出现了交易成功率下降
?? 客户端性能小幅下降,但不影响使用;
?? 系统运行指标(例如: I/O 效率、 CPU 效率)受到直接或间接影响,客户业务处理受小量影响;
?? 五个四级及以上,升级为三级故障
≤6小时
≤3天
四级
四级故障:客户端可以使用,不影响业务处理
当系统出现下列情况而不影响客户业务时,属四级故障:
?? 客户端界面出现显示问题,如ui不符合设计;
?? 后台系统中有大量的冗余信息,导致空间不足;
?? 系统硬件或者软件没有及时升级,不符合安全策略等等
≤12小时
≤5天
故障响应时间表
故障等级
通知公司响应人员
作出解决方案
赶到现场
解决时间
一级
15分钟
2小时
8小时
24小时
二级
30分钟
3小时
12小时
48小时
三级
60分钟
6小时
24小时或无需到现场
72小时
四级
90分钟
12小时
无需到现场
120小时
故障定级
故障累积升级
按照不同的故障分类需要进行相应的处理,但是有时问题会重复出现或者同类问题出现了多个,进行故障升级。
例如:开发人员发现了一个ui问题,这是一个四级故障,他应该通知他的组长进行统筹处理,在该组长进行处理时发现了十个类似的问题,这个问题直接升级到三级故障,由该组长负责向项目经理通知,并进行全面查找问题,进行统一解决,做到故障的全部解决。
??四级故障数 = 5,升级为三级故障
??三级故障数 = 3,升级为四级
文档评论(0)