- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
运维,这里指互联网运维,通常属于技术部门,与研发、测试、系统管理同为互联网产品技术支撑的4大部门,这个划分在国内和国外以及大小公司间都会多少有一些不同。一个互联网产品的生成一般经历的过程是:项目立项、需求分析、研发部门开发、测试部门测试、运维部门部署发布以及长期的运行维护。运维,本质上是对网络、服务器、服务的生命周期各个阶段的运营与维护,在成本、稳定性、效率上达成一致可接受的状态。
-----宋停云与您分享------
-----宋停云与您分享------
故障管理和故障处理流程规定
(暂行稿)
工程运维中心 二〇〇八年八月
-----宋停云与您分享------
-----宋停云与您分享------
目 录
第一章 目的… 3
第二章 工程运维中心在95013业务维护管理中的职责… 3
第三章 95013业务故障分类… 3
第四章 故障处理的原则: 4
第五章 故障处理时限要求。… 4
第六章 故障管理和故障报告制度… 4
第七章 故障通报制度… 5
第八章 故障处理及报告流程图… 5
第九章 工程运维中心内部处理流程… 6
第十章 外部支持流程(研发、建设和其他厂家)… 6
第十一章 工程运维中心各部门及公司相关部门的责任… 7
第十二章 故障的跟踪管理… 7
附件一:95013业务重大/严重故障分析报告… 9
-----宋停云与您分享------
-----宋停云与您分享------
第一章 目的
工程运维中心承担95013业务网络和平台日常维护工作,为规范故障管理 和故障处理的工作流程,使网络和平台故障能够得到正确及时地处理,保证 95013业务安全稳定的运行,特制定本规定。
第二章 工程运维中心在95013业务维护管理中的职责
a)工程运维中心网管中心值班工程师和各分公司运维人员承担95013业务的日常运行监控和维护工作。
b)工程运维中心运维组负责95013平台的故障处理;各地分公司运维人员负责现场支持,并负责协调当地运营商的运维支持。 c)建立故障通报制度,如发生重大故障,应按照故障等级和故障上报流程逐级向上汇报。
d)定期召开网络质量分析会,遇有重大故障,应及时召开故障分析会。
负责全公司运维人员的技术业务培训,提高运维人员的技术维护水平和工作能力。
第三章 95013业务故障分类
95013业务系统和网络故障分为重大故障、严重故障和一般故障。
重大故障:全部业务中断
严重故障包括:
一种以上业务全部中断≥60分钟一省以上业务全部中断≥60分钟
用户注册、业务受理全部中断≥4个小时
一般故障:除重大故障、严重故障以外的其它故障。
-----宋停云与您分享------
-----宋停云与您分享------
第四章故障处理的原则:
先抢通,后修复;先核心,后边缘;先本端,后对端;先网内,后网外, 分故障等级进行处理。
第五章故障处理时限要求。
重大故障,故障处理时限≤2小时。
严重故障,故障处理时限≤4小时。
一般故障,故障处理时限≤24小时。
第六章故障管理和故障报告制度
a) 发生故障时,各级运维人员应按照故障等级和时间,逐级上报。当严重故障时间≥1小时,运维组人员应报告给工程运维中心。 当严重故障时间≥2小时,上报给公司主管副总。
当严重故障时间≥4小时,上报给公司总裁。
当网络和平台出现重大故障时,各级运维人员应在第一时间逐级上报。
对于95013业务系统各级故障,若在规定故障处理时限内未能恢复,故障级别自动上升一级,故障处理人员应按新的故障等级进行处理。
重大故障发生或其他故障升级为重大故障后,如果超过故障处理时限1小时仍未能解决,需升级到工程运维中心协调解决;如果工程运维中心2小时内仍无法解决,需由工程运维中心升级上报到公司管理层。
d) 重大故障处理结束1个工作日内,工程运维中心运维组应填写故障报告并上报工程运维中心。
e) 重大故障处理结束后的2个工作日内,提交《95013业务重大/严重故障分析报告》。
-----宋停云与您分享------
-----宋停云与您分享------
网管监控软件客服投诉运维报修发
网管监控软件
客服投诉
运维报修
发
现
明确故障现象
故障判断、定级
是否有能力处理?
上
报和处
理
研发技术人员
根据情况通知建设
部门或设备厂家
Y
是否有能力处理?
上报时限处理完成
Y
共同处理故障
规定时限内处理完成
Y
Y
归档
事件处理管理平台
总部客服平台
市场管理
各级领导
客服通报:当出现故障时,工程运维中心应立即通知客服,通报故障影响范围、故障处理可能需要的时间,以便客服对用户解释。故障解决业务恢复正常后,应及时通知客服部门。故障处理完以后,应向客服部门通报故障原因, 以及采取的措施。
市场部和业务部门通报:工程运维中心根据故障的具体情况,向市场部或 其他业务部门通报。
第八章故障处理及报告流程图
总部运维组 研发技术支持 外部支持
-----宋停云与您分享------
-----宋停云与您分享------
第九章工程运维中心内部处理流程
故障输入包括网管监控发现故障、客服收到用户投诉、各地运维上报、市场业务部门投诉和其他途径告知。
运维组制
文档评论(0)