- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
样章_海量运维监控系统规划与部署(基于LinuxNagiosCentreonNagVis等)
企业级 IT 监控系统概述
众所周知,随着中国经济的迅猛发展,国内企业的信息化发展也取得了前所未有的
成就,无论是部署规模还是运维规模都变得庞大起来。伴随而来的企业信息化需求逐步迈
向多元化,层次化,异构化,使得 IT 基础框架和上层应用日益复杂。为了确保信息服务质
量、提升安全性,对于在此类企业从事 IT 运维工作的管理人员和技术人员来讲,如何及时
获得信息系统告警信息、迅速定位故障原因、快速高效地处理各类 IT问题、降低故障率和
故障响应时间等等,就称为亟待解决的问题和难点。
目前来说,很多企业的核心业务都已经完全信息化。为了确保业务稳定可靠,并且快
速有效地开展,企业经常会运用多个信息系统进行消息传递和系统交互,从而加大了故障定
位的时间和问题解决的难度。面对系统宕机或者服务中断,每一位负责任的 IT 运维管理人
员在面对用户的投诉、领导的问责、同事们的紧张时,无不在殚精竭虑地思考如何能够快速
准确地定位系统故障,及时采取有效手段使故障能够快速解决,业务能够及时恢复。如此一
来,研发并部署一套适合企业特点的,能够统一管理和展现各种监控资源,实现集中告警,
全面协助 IT 运维管理人员实时掌握系统整体运行状态,快速定位故障,缩短处理时间的企
业级 IT 运维监控系统就显得迫在眉睫了。
什么是 IT 运维监控系统
既然 IT 运维监控系统这么重要,那么究竟什么才是 IT 运维监控系统呢?
所谓 IT 运维监控系统,有如下两层含义- “监”指的是对其他服务器的检测、监视;
“控”指的是对其他服务器的控制,掌控。IT 运维监控系统往往是一套独立的信息系统、或
者是若干信息系统的集合,用以对其他信息系统进行问题检测,甚至能够实现对其他信息系
统进行部分或者完全的远程控制。
例如,就服务器检测而言,监控系统能够周期性地连接到一个 HTTP 服务器上,检测
其是否能够正常响应浏览器的请求。又例如,监控系统能够接收系统管理人员的指令,在被
监控的服务器上执行一个脚本,完成某项控制类操作。这一切听起来好像很简单,但是别忘
了,许多商业性质的系统监控软件都不再是简单的单一软件,而是摇身一变,成为多个组件
在一起才能发挥作用的“套件”,且售价动辄都是上百万人民币,还不算上后期的实施和维
护费用,其客户端的大小都在数百兆以上,成为不折不扣的重量级选手了。
如果实施得当的话,一套好的IT 运维监控系统可以成为各类信息技术人员最好的朋友。
它能在信息系统出现灾难之前就提前告知系统管理员某些细微的故障症候,使管理人员能够
未雨绸缪,及早采取措施避免系统发生不可修复的错误。它也能够记录系统某些规律性的行
为,使管理人员借以梳理并总结出信息系统的普遍行为,规划出系统的运行负载和服务能力。
IT 运维监控系统还能够协助信息安全工程师发觉系统运行中的异常信息,能够实现 IT 运行
的可视化,以帮助企业高层及时掌控信息系统的实时状态。如果 IT 运维监控系统更加智能
的话,它甚至在发现故障之后自行解决故障,而不用值班人员在发现故障后凌晨给系统管理
员打电话惊醒对方的美梦。也就是说,好的 IT 运维监控系统能够给企业信息技术人员和管
理人员注入正能量,使大家能够非常愉快地投入每天的工作,而不是充当救火队员时刻紧张
地准备冲到第一线。
但往往理想很丰满,现实很骨感。很多时候,我们遇到的往往是糟糕的监控系统,它带
给我们的只有种种的不快,例如如下场景,您是否似曾相识:
某些监控系统在遇到系统故障时,常常不报警、或者总是报警,不是让管理人员挨
上级批评,就是被频繁的报警短信或者电话逼疯。一般来说,前一种情况往往是由于监控系
统长时间没有得到有效维护,继而导致无法发出有效报警引起的;而后一种情况则是由于监
控项得不到合理调整而频频触发监控阈值引起的。
某些监控系统往往在被监控端部署庞大的客户端程序,长时间运行后产生各种各样
的问题,例如消耗服务器资源、触发服务器过度负载、引发安全漏洞、产生庞大的网络流量
等。
某些监控系统缺乏服务商良好的技术支持。随着监控项的增多,监控项报警的能力
逐渐丧失,效率越来越低,或者服务商提供的服务费用较高,增大了企业的运营成本。
某些监控系统技术封闭,管理人员缺乏对该系统的全面了解,在出现报警故障等问
题时无法寻找有效的技术支持,影响系统安全。
某些监控系统架构封闭,可扩展性较差,无法针对业务灵活地添加或者调整监控项。
某
文档评论(0)