米莫运维监控详解.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
设备监测数据 设备监测数据 设备监测数据 业务访问数据 业务访问数据 Oracle运行数据 Oracle运行数据 告警信息 告警信息 感谢聆听 * 当组织机构依托IT技术开展业务时,我们甚至可以这样认为:IT建设的成败将直接影响到生产效率,甚至影响到生产效益!我们可以假想一下,一个用户登录网上商城购物,而他打开一个产品介绍的页面感觉很慢,下单付款的关键时刻又发现系统失去响应,那么这个用户还会选择继续在网上商城消费吗?作为纳税人,我们通过网上报税系统进行申报、入库操作,但是如果我们发现这个系统有时可以登录,有时无法登陆,无规律中断,我想这肯定也不会让我们满意。 * 伴随着,新业务不断涌现,老业务不断扩容。传统的IT运维部门来说,面临的职业压力也持续增大。而网络设备、服务器、软件应用系统等越来越多,错综复杂的关联关系,让数据中心的管理和维护面临前所未有的挑战。 * 我们发现,往往即使我们已经部署了网管系统,但是我们的IT服务并不能达到客户的要求。通过“统一运维管理平台”模拟用户访问行为,发现财务系统访问速度没问题,但事实与模拟的结果并不相符;从网管平台上看到网络设备、服务器的的CPU占用很低,但仍然有用户投诉应用访问缓慢甚至中断……这给我们的工作带来了极大的困扰。 导致以上问题有两个原因,一是传统网管系统理念的局限性,缺乏关联分析。引发用户访问变慢或中断的原因并不仅仅局限在硬件设备,诸如带宽被挤占、网络连接失败、应用软件效率低下都会导致问题的出现,单纯的关注硬件并不能解决所有问题;二是技术的局限性,通过模拟一个客户端访问应用服务器的方式,所获知的信息都是“模拟”信息,而并非“用户真实体验”,可以作为系统上线前的一次“演习”,但是系统上线之后的日常监控管理,则必须是“实时的、真实用户体检监控”,否则我们就只能在问题已经发生、损失已经造成之后才后知后觉。 * 在这样的环境下,我们提出了一套业务系统监控的解决方案 * 服务器及硬件监控主要涵盖日常生产中的三个方面:服务器稳定性监控、网络数据监控、应用中间件性能监控 * 主要的分析手段是通过:SNMP、WMI、等协议获取被监控主机的性能状态信息,通过主动探测技术判断系统监控状态,将结果传给 数据库模块 通过数据包抓取模块抓取网络上的数据包,进而分析出所需要的信息,将结果传给 数据库模块 数据库模块:存放详细的分析结果,供报表、WebUI等其它模块查询 * 第三部分介绍具体的技术实现 * 为了满足IT运维人员对于系统的维护需求,降低维护难度,我们提供7x24小时不间断性能检测机制,SNMP Trap、应用响应阀值等实现自动告警,协助故障定位,减少故障恢复时间。 SNMP 模块能够获取硬件服务器、网络设备的性能与状态属性,包括CPU ,内存,状态,进程,磁盘I/O。 网络抓包引擎可以快速的解决系统涉及的线路异常、流量异常、硬件异常、应用变慢、系统中断等节点故障,在客户之前发现问题、解决问题。 最终通过数据分析引擎呈现在中端大屏幕上。 * 在访问业务服务器必经的核心交换机上配置镜像接口,并将镜像接口和硬件监控设备的Probe口进行连接,采集网络数据,同时通过路由方式获取各应用服务器的硬件信息。 将硬件监控设备的MANAGE口和内网交换机相接 将采集后的信息通过路由与应用服务器对接,将数据按照设定规则进行匹配。最终进行大屏展现。 * 上大屏是实现网络可视的目标,主要上大屏的数据: 1. 统计线路流量、系统流量、主机流量、协议流量、会话流量、来源流量 2. 以SNMP、WMI等方式统计设备信息,包括:CPU、进程等 3. 识别异常的流量 和 异常的设备信息 设计思路、原理及背景 系统以 “旁路方式” 分析和统计数据中心的 “数据流” ,并保存在 “数据库” 中,通过web以总览视角、系统视角、主机视角、协议视角、会话视角展示出来。 * 旁路数据流分析。在网络侧开辟旁路,通过分光或者数据镜像的方式,采集网络数据,主要用于对网络流量数据进行分析 * 主动捕获网络信息分析,应用对于网络设备进行主动查询,并返回查询结果,提供用户解析使用。主要用于对于系统硬件信息进行监控 * * 米莫运维监控方案 目录 1.背景分析 2.方案综述 3.技术实现 4.应用场景 基于IT系统的工作与生活 不断有新业务系统部署上线 新用户不断增加,系统扩容 应用系统 网络性能 数据库 硬件 问题来源 目录 1.背景分析 2.方案综述 3.技术实现 4.应用场景 网络数据监控 服务器稳定性监控 应用中间件监控 目录 1.背景分析 2.方案综述 3.技术实现 4.应用场景 数据分析 大屏监控 告警通知 SNMP Trap/Get 网络抓包引擎 运维监控 方案 运维监控网络拓扑图 运维监控系统架构 网络数据监控 网络数

文档评论(0)

x5511167 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档