网站大量收购闲置独家精品文档,联系QQ:2885784924

运维制度及流程.docxVIP

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

运维制度及流程

一、目的

1.1、为明确运维部人员工作职责(重大责任)以及以往效劳器故障处理过长导致百米用户流失并对业务扩张带来的影响,特制定本制度来标准运维人员的工作。

二、工作范围:

2.1、架构设计

为研发部门供应非代码方面的运维技术帮助,并在产品开发初期或部署阶段与开发共同确认架构运行程序和效劳器部署构造。2.2、运行监控

对线上生产环境中的效劳器、交换机等各类设备以及关键程序运行状态进展7x24小时轮班人力监控,假如遇到运行故障能在5分钟内获得通知,并马上开展应急处理工作(每天至少1人负责)。

2.3、数据维护

公司业务内的各种关系和非关系数据库中长久化存储的数据备份,并将备份数据从生产效劳器保存到线下公司内部的存储器中并建立数据仓库。为运营部门建立和维护运营数据“仓库”,并开发部份运营数据挖掘工具。

2.4、企业信息化建立

公司内部办公自动化设备的选购选型、维护、组装,以及帮助行政或财务部对该类物品进展资产治理。办公网络系统组建,例如内部文件共享、邮件、IM等办公协同效劳系统的组建和维护。

2.5、运维技术文档资料治理

公司生产效劳器(外网)部署架构图、效劳器软件安装清单、效劳器密码治理等。

三、架构设计工作细则

由于研发人员对数据库以及效劳器架构方面不是很擅长,需要运维部DBA和架构师帮助进展产品研发初期或产品部署阶段的帮助。主要工作要点如下:

3.1、数据库构造设计:数据库的分布式运算架构设计,例如:读写分别;数据表的分割存储,存储引擎的择优;数据表字段的类型及数值格式择优。

3.2、效劳器架构设计:常见的有效劳器网络分布,效劳角色合并等等。

3.1、运维自动化工具开发:主要采纳系统的Shell脚本或Python、C/C++语言,开发常用的自动备份、监控警报等工具,削减人力本钱,加强维护监管的精准度。

四、运行监控工作细则:

4.1、运行监控工作需7x24小时不连续的对全部生产环境中的效劳器、路由器以用效劳端软件进展监控。

运维监控工作按每天24小时计算,由运维现有工程师每人轮班,假设为ABCDE五名员工,详细排班表见附件《运维轮排表》

4.2、运维工作中监测到特别时需按以下流程来处理:

1)记录具体的故障病症及相关输出信息

运维部会开发一套运维工作日志系统,用于记录每次故障的详情,以便日后对故障进展后续跟踪和职责过失判定。

2)进展应急处理

运维部与研发部双方会不断交涉更新汇总出一份常见故障应急处理方法的手册,以B/S形式发放至每一位运维工程师。当消失突发故障时,运维工程师在记录下故障详情后,则根据该手册结合自己的技术阅历来进展故障修复。

3)公布紧急维护通知(运营部=技术支持和商务部)

当故障在10分钟内无法恢复时,应属于紧急维护,需要对外公布维护公告。依据公司制度,运维工程师需先上报至运维部负责人(负责人再次推断10分钟内是否能解决,能解决则直接解决),再由运维部负责人通知运营部负责人公布通知。

为了防止联系不上运维或运营部负责人以及公布公布专人,运营部需有权用运营部拟定的维护公告模板来公布紧急维护公告,但是由运维部公布的维护公告,需事后由运维及运营部负责人签字确认缘由是有相关负责人联系不上。

4)运维部开头进展后续技术处理直至问题解决

较简单的故障处理工作在公布紧急维护公告之后,运维部负责人需组织运维工程师进展后续的故障排队工作直至问题解决

4.3、运行监控中常消失的故障分为三个类别:硬件故障、软件故障、网络故障。由于效劳器等硬件在外地IDC机房,而网络故障大多出在IDC、ISP环节,运维不能自行处理,需走对外的行政流程,因此对于运维工作的过失推断主要从软件故障上进展。

假如是因产品程序负载力量引起的故障,不属于运维工作失职。因此每次消失故障之后都需要记录详情,以便跟研发人员一起找出故障缘由。

五、数据维护工作细则

数据维护工作主要分为生产环境中的过期数据定时分割到公司内网的本地“数据仓库”中进展备份存储,以供后续进展数据挖掘分析。同时还需定时备份生产环境中的线上数据以便消失意外状况时进展数据恢复。数据维护工作主要分以下步骤:

5.1、每周将线上实时数据按月进展分割备份,例如广告统计、认证上网统计、网站访问统计等数据,把30天以前的数

文档评论(0)

130****3919 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档