- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
运维工作规划.doc
运维工作简介
系统简介
服务器数量与用途
运维管理范围与职责
管理范围
本平台内所有架构,运维部负责公司业务系统运行维护工作。
职责
保障公司游戏服务器的正常运行、网络的畅通。
严格岗位制度、明确工作职责,规范工作流程。
工作规范化,制度化,加强文档管理力度。
组织结构
根据运维工作的范围和性质,下设三个小组:
系统维护组
应用维护组
技术值班组
服务维护
系统维护
检查安全日志
检查系统日志
检查应用日志
记录并核对各系统磁盘容量
记录并核对各磁盘文件数量
记录并核对系统账户
记录并核对系统服务
记录并核对系统进程CPU内存 PID 线程数
查询系统更新
应用维护
检查各应用程序状态
记录并核对各应用程序配置
记录并核对应用系统文件
记录并核对应用系统文件MD5
测试各应用系统功能
记录并核对各应用系统CPU内存 PID 线程数
检查应用程序更新
网络维护
检查服务器连接数量
检查上行下行带宽记录值
检查网络损耗峰值
检查并记录各服务通信端口
检查并记录通信延迟
分析带宽负荷
分析访问量
硬件维护
检测并记录各硬件温度
检查驱动状态
检查各硬件状态
数据库维护
检查备份文件
核对备份时间
核对备份内容
查询并记录锁定
查询并记录SQL效率
对比数据内容
交接班进行日志数据库备份
实时检查日志数据库
服务器实时监控
磁盘文件增减监控
通信效率监控
服务器使用率监控
服务器性能监控
网络上行下行带宽监控
数据库操作监控
硬件温度监控
工作内容
1.设备管理:对网络设备、服务器设备、操作系统运行状况进行监控和管理。
2.应用/服务管理:对各种应用支持软件如数据库、中继、CDN以及各种通信或特定 服务的监控管理,如DNS、Web 等的监控与管理。
3.数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复。
4.数据管理:包含对公司自身核心数据系统的运行情况的监控与管理,对于数据的管 理,主要关注该数据系统的消耗与增长。
5.内部系统管理:该部分主要对于本公司需要统一发布或因人定制的内容管理和对 公共信息的管理,如客服系统、推广系统。
6.资产管理:管理本公司服务系统???资产情况,是逻辑存在的,并能够与本公司财务部 门进行数据核对。
7.信息安全管理:目前信息安全管理主要依据的是企业安全组织方式、资产控制、人 员安全、物理与环境安全、通信与运营安全、访问控制、数据连续性管理等。
8.日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供 运维日志报表、提供解决经验与知识的积累与共享手段。
应急预案
预警机制
预警级别警报内容预警级别介绍一级预警网络流量升高
系统资源升高
数据备份出现异常
热备份出现异常
监控软件出现故障一级预警表示系统出现故障,但不影响运维系统的正常运转。二级预警超过系统资源
超过网络资源
网络中断或网络异常
防御资源内的攻击
操作系统出现异常
应用系统出现异常
数据库相关异常二级预警表示系统出现故障,影响运维系统的正常运转,但运维工程师可以在短时间内进行故障排除。三级预警超过防御资源的攻击
硬件物理损坏
操作系统出现不可恢复性故障
数据库无法正常使用
三级预警表示系统出现故障,影响运维系统的正常运转,运维工程师不能在短时间内进行故障排除。四级预警
ISP IDC 机房故障
受到不可抗力或自然灾害的破坏。
四级预警表示系统出现故障,运维系统中断,运维工程师无法排除。
预警上报处理流程
运维过程中出现重要故障或紧急情况时,按以下规定流程进行处理及汇报。在遇到故障时,及时汇报上级领导并采取措施及时解决,具体汇报流程如下:
一级预警
当通过监控或得知系统出现故障时,首先在最短的时间查看故障点状态,并分析故障原因。
运维工程师在排查出故障后,立即着手解决。
3.在故障排除后,通知组长并对所发生故障的设备进行事后跟踪。
4.在故障排除后,运维工程师应对故障原因及解决办法进行详细说明。
二级预警
1.当通过监控或得知系统出现故障时,首先在最短的时间查看故障点状态,并分析 故障原因。
2.运维工程师在排查出故障后,如能够立即解决,则立刻解决故障,如需要相关技术人员到现场,应立即拨打技术工程师联系电话,请求立即到现场进行故障排除。
3.立即报告运维中心主管人员,主管人员应通过电话或当面把故障报告给相关技术部门。
4.在故障排除后,运维工程师应对故障原因及解决办法进行详细说明。
三级预警
当通过监控或得知系统出现故障时,首先在最短的时间查看故障点状态,并分析故障原因。
2.运维工程师在排查出故障后,如能够立即解决,则立刻解决故障,如需要相关技 术人员到现场,应立即拨打技术工程师或第三方技术部门联系电话,请求立即协调 进行故障排除。
3.立即报告给运维中心主管人员
您可能关注的文档
最近下载
- 水泥基工程复合材料ECC的研究与应用论文.pdf VIP
- 血透室品管圈.pptx
- 《新能源汽车维护与保养》教案 第11课 车身电气设备维护与保养.doc VIP
- GB 20951-2020 油品运输大气污染物排放标准(高清版).doc VIP
- 2025-2026学年小学信息技术(信息科技)三年级上册湘科版(2024)教学设计合集.docx
- 优质纪念中国人民抗日战争暨世界反法西斯战争胜利80周年PPT课件.pptx
- 第八章 现代生物技术在环境保护中的应用.ppt VIP
- 千年古县申报材料-牟平.doc VIP
- 慢性咳嗽诊治指南ppt课件.pptx VIP
- 企业安全生产风险辨识评估管控指导手册-件杂货码头.pdf VIP
文档评论(0)