- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
13f运维维护手册-linux.
运维维护手册-linux
13F运维维护手册-linux 1
1. 概述 2
2. 维护工作项 2
2.1 业务系统 2
2.2 服务器公共检查项 2
2.3 WAS服务器 10
2.4 WEB服务器 11
2.5 数据库服务器 13
2.6 机房巡检 17
概述
本手册描述运维要做的日常维护工作,在后续的维护工作中,维护人员可将工作中总结的维护经验添加进来,不断更新完善本文档。
在平时例行检查中一旦出现检查不通过项,请及时和相关负责人联系。
维护工作项
业务系统
序号 业务-01 检查项目 检查业务系统是否可以正常登陆 检查周期 日 检查操作 打开公司的商城系统以及其它业务系统,进行在线登录测试 判定条件 是否可以登录系统 补充说明 如果登陆出现问题,保存好错误信息,及时通知项目负责人
序号 业务-02 检查项目 业务系统响应情况 检查周期 日 检查操作 通过【业务-01】的检查,分别登入各个自系统时,体验各个系统响应的速度 判定条件 是否比正常时候明显感觉到慢 补充说明 如果明显感觉很慢,则及时通知相关负责人
服务器公共检查项
需检查的服务器列表见前期整理的《13楼门户设备信息表》。
序号 服务器-1 检查项目 检查各个磁盘及分区的空间占用情况 检查周期 日 检查操作 df –h或是df –k 判定条件 查看已占用空间是否大于80% 补充说明
序号 服务器-2 检查项目 检查CPU平均负载情况 检查周期 日 检查操作 Uptime或是top命令 判定条件 Load Average 数值 CPU内核数量之和(linux:8个CPU内核 ) 补充说明
Load Average内容表示在过去的1、5、15分钟内运行队列中的平均进程数量
序号 服务器-3 检查项目 检查CPU占用率 检查周期 日 检查操作 vmstat 1 5或是top命令 判定条件 当idle列值长时间小于25%,说明CPU负载较大,需要联系项目负责人。 补充说明
Us=user 用户使用
Sy=system 操作系统使用
Id=idle 空闲
序号 服务器-4 检查项目 检查进程状态、数量及进程的CPU占用情况 检查周期 日 检查操作 top 判定条件 无state为”zombie”的进程(僵尸进程),进程总数小于500,某一进程的CPU占用率不长时间保持不变即为正常,否则需联系系统管理员。
(Linux下可通过ps -ax| grep Z查找僵尸进程;查找到僵尸进程的父进程进行kill一定要确定父进程是什么;Zombie进程不可以用kill命令清除,因为进程已退出,如果需要清除这样的进程,那么需要清除其父进程,或是等很长的时间后被内核清除。因为 Zombie的进程还占着个进程ID号呢,这样的进程如果很多的话,不利于系统的进程调度。) 补充说明
序号 服务器-5 检查项目 检查内存交换 检查周期 日 检查操作 top(linux swap行信息为交换分区内容) 判定条件 若内存交换区的空闲率小于90%,需联系系统管理员处理 补充说明
(如上linux:free/total=空闲率)
序号 服务器-6 检查项目 检查系统管理员邮件 检查周期 日 检查操作 mail (linux中root用户的邮件都会保存在“/var/spool/mail/root”文件中) 判定条件 视邮件内容而定,主要看有无fail,error,kerl信息 补充说明 检查操作系统发送给管理员用户root的邮件,有些警告或错误或应用软件如crontab的信息,会以mail发式发送到root用户的系统邮箱中。
序号 服务器-7 检查项目 检查操作系统日志 检查周期 日 检查操作 more /var/log/messages(linux) 判定条件 日志中没有报错。无warning、error、fail等异常提示。 补充说明
序号 服务器-8 检查项目 检查系统空闲内存 检查周期 日 检查操作 free(linux)(或free –t,swapon –s,procinfo) 判定条件 如果内存使用率超过80%,则需要联系系统管理员。可以通过如下数据进行估算使用率。 补充说明
Linux 内存使用率=used/total
序号 服务器-9 检查项目 检查网卡状态 检查周期 日 检查操作 ifconfig –a
从其他服务器上ping 判定条件 检查各网卡配置状态是否是“UP”(主要查看那些配置IP地址的网卡)
观察ping 1分钟或是100个包是否有丢包情况(可以以某一服务器为源端,按照前期整理的《13楼门户设备信息表》服务
文档评论(0)