- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
互联网监控的艺术
演讲人:田逸
监控演变历程
用户、老板电话通知
Ping主机
放在线收音机
时不时登陆系统查看状态
使用监控平台
必要性
被动方式延误时机,并且给技术人员产生巨大
的压力
Ping主机对于服务器数量多的场合会怎么样?
服务器在远端,无声卡等,放不了在线收音机
音频
数以百计甚至上千计的服务器,挨个登录恐怕
是个困难
部署监控平台,随时了解大规模网络运行的状
态,并且在出现意外时及时报警
高可用性的保证措施
高可用架构:应用集群、负载均衡、分
布式文件系统、数据库集群等
设计良好的监控系统
选择何种监控方式
自己写程序或者脚本小工具
商业解决方案
开源的方案
自己写程序或者脚本
优点
1、现金成本低
2、操控性强
不足
1、集中管理是个问题
2、无可视性效果
3、调度需要好的技巧
4、运营复杂,如监控一个集群,需要对集群维
护。因程序被安装在每个主机,因此可能要重
复n次操作
商业解决方案
优势
1、大包大揽
2、用户不用承担运营中的责任。假如出了问题,
可把责任推给厂商。
3、很受欢迎的展现方式,如报表、美观的用户
界面
不足
1、成本高(一般以万计)
2、取舍不易:需要的功能可能不足,不需要的
功能一大堆
商业解决方案(续)
3、巨大的资源占用:就client代理而言,
包大小基本以百兆字节计
4、扩展性差。要新增模块,需要昂贵的支
出
5、安全问题。来自代理agent的权限。
开源解决方案
优势
1、开源免费
2、定制能力强
3、完全可控
4、集中化管理
5、可视性好
不足
1、需要很强的技术实力
2、一切靠自己
推荐的方案
开源的方案
Nagios、zenoss、Ganglia 、zabbix 等
本案以nagios为例
谁在使用nagios
Facebook
搜狗
网易
空中网
新浪
阿里巴巴
互动百科
Sohu
其他更多…….
什么是nagios
Nagios是一个框架,核心部分是调度器
和状态通知模块。
调度器调度插件或者任意定制的可执行
程序,根据执行结果返回状态值,并根
据需要进行相信的报警/通知
Nagios监控机制
检查登录用户数的场景
条件:
1、当登录数小于5时,属于正常
2、当用户数大于5小于8时,应当警告
3、大于8时为异常
脚本:logins.sh
检查用户登录脚本(续一)
#!/bin/sh
logins=`who |wc -l`
if [ $logins -le $1 ]
then
echo OK!-login count is $logins
exit 0
fi
if [ $logins -gt $1 -a $logins -le $2 ]
then
echo Warnning!-login count is $logins
exit 1
fi
if [ $logins -gt $2 ]
then
echo Critical!-login count is $logins
exit 2
fi
检查用户登录脚本(续二)
手动执行脚本,形如./usercon.sh 5 8
输出:
1、有2个用户登录时:OK!-login count is 2
2、有6个用户登录时:Warnning!-login
count is 6
3、有9个用户登录时:Critical!-login count
is 9
调度脚本
本地调度:用于检查远程服务端口等
远程调度(Nrpe):检查主机资源、检查
内部网络服务
设定调度时间间隔、重试次数等。注意
与crond不同。
通知机制
退出代码为0,代表正常
退出代码为1,代表警
文档评论(0)