善用脚本让你的Nagios记录系统监控日志.docVIP

善用脚本让你的Nagios记录系统监控日志.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
善用脚本 让你的Nagios记录系统监控日志(附vmstat详解) 摘要:Nagios是一个有着强大报警功能的系统监测工具,不过美中不足的是Nagios并没有提供记录状态和日志的功能,无法满足分析系统繁忙原因的需求。本文提供一段脚本,可以以vmstat为基础实现这个需求,在系统繁忙时分离出日志,供系统组同事们一起分析问题。 【51CTO独家特稿】我是一名linux/unix系统工程师,平时用Nagios自动监测公司的内网开发环境及外网应用环境。Nagios报警功能很强大,但有时我们的系统组有这个需求,特别是系统繁忙时希望能留下日志,以供分析:到底是受到了攻击,还是开发人员设置不当,亦或是运维人员改动了系统配置等。机器少时可能问题不大,但公司的CDN服务器集群是一百多台,目前看形势还在增长,所以我想设计一个shell脚本来作Nagios的补充,在系统繁忙时分离出日志,供系统组同事们一起分析问题,得出问题的症结所在。 这里介绍下以vmstat为基础的系统监控脚本/root/monitor.sh 此脚本设计思想与功能实现: 此脚本设计为Nagios监控补遗,Nagios是即时监控服务器状态并即时报警,但美中不足的不能记录其状态及日志,所以设计此脚本; 此脚本已在FreeBSD上成功调试运行,亦适用于RHEL/Centos系统; 这里以常用生产服务器HPDL380G6(英特尔至强E5540@2.53GHz双四核)为依据,r的阀值为4; 脚本内容如下 #!/bin/bash ? while?:? ? do ? vmr=`vmstat?|?tail?-1?|?awk?{print?$1}` ? if?[?${vmr}?-gt?4?] ? then ? date????/root/monitor.txt ? vmstat??/root/monitor.txt ? netstat?-anp??/root/monitor.txt ? ps?-aux?/root/monitor.txt ? last????/root/monitor.txt ? tail?-10?/var/log/messages??/root/monitor.txt ? fi ? sleep?60? done ? ? 此脚本可放至后台运行 sh /root/monitor.sh ,如遇CPU繁忙的情况,它会自动记载系统日志等以供分析。 这里补充下vmstat的详细信息。这部分资料参考南非蜘蛛,如有问题可咨询本文作者抚琴煮酒:yuhongchun027@163.com。 用vmstat监视内存使用情况 vmstat是Virtual Meomory Statistics(虚拟内存统计)的缩写,可对操作系统的虚拟内存、进程、CPU活动进行监视。它是对系统的整体情况进行统计,不足之处是无法对某个进程进行深入分析。 vmstat的语法如下: vmstat [-V] [-n] [delay [count]] 其中,-V表示打印出版本信息;-n表示在周期性循环输出时,输出的头部信息仅显示一次;delay是两次输出之间的延迟时间;count是指按照这个时间间隔统计的次数。对于vmstat输出各字段的含义,可运行man vmstat查看。 vmstat命令有四个可选标志可供使用。如果机器有虚拟地址缓存-c标志就改变输出报告缓存刷新统计数据。报告包括自从系统启动后每种缓存刷新全部总量。六个缓存类型是用户,上下文,区域,段,页,部分页。 -i标志 使输出变为报告中断的数量。如果给出设备名,如d1,d2等,监控将在设备级*执行,(*注,参阅第十二章有关打开设备级监控的信息。)并报告每个给定设备的统计信息。 修改普通报告来显示交换而非页面调度活动的信息。这选项改变显示的两个字段:si(换入)和so(换出)替代了re和mf字段。 值得注意是,interval 和count选项对-i或-s选项是非法的。 vmstat 参数详解 procs: r--在运行队列中等待的进程数 b--在等待io的进程数 w--可以进入运行队列但被替换的进程 memoy swap--现时可用的交换内存(k表示) free--空闲的内存(k表示) pages re--》回收的页面 mf--》非严重错误的页面 pi--》进入页面数(k表示) po--》出页面数(k表示) fr--》空余的页面数(k表示) de--》提前读入的页面中的未命中数 sr--》通过时钟算法扫描的页面 disk 显示每秒的磁盘操作。 s表示scsi盘,0表示盘号 fault 显示每秒的中断数 in--》设备中断 sy--》系统中断 cy--》cpu交换 cpu 表示cpu的使用状态 cs--》用户进程使用的时间 sy--》系统进程

文档评论(0)

orhchv6 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档