多应用系统业务探针应用探究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多应用系统业务探针应用探究

多应用系统业务探针应用探究   摘要:在网络和业务管理系统中最常用到的探针多是基于端口扫描技术的探针。通过程序后台模拟用户对业务系统的真实操作,分析了业务系统的响应时间和返回内容,从而预知业务系统是否正常使用。如果业务系统不可用或者响应时间过长,仿真探测程序就会自动产生告警,通过告警对用户或网管人员进行提示。 关键词:探针;业务系统;健康度 中图分类号:TP303 文献标识码:A 文章编号:1672-7800(2014)003-0049-03 0 引言 在一个企业中,通常有针对网络和应用系统进行检测的需求。而现有的检测程序一般都是针对网路端口进行的,以设备监控为主,这种方式只能监控支撑业务系统运行的设备状态,并以此判断系统是否可用。这种方式存在一定的弊端,实际工作中经常出现基础设施各项指标完好,但业务系统应用出现故障或无法响应的情况。同时,业务运营情况缺乏有效的分析指标,这主要是因为业务层层嵌套、互相关联,同时受制于基础设施的稳定性,运维人员很难具体衡量出业务运营是否健康,更谈不上有效发现业务运行的潜在威胁。 本文采用在业务系统和用户终端中植入探针的方式,通过探针提取业务应用指标信息,通过基础设施和应用联合指标建模,可以实现业务的整体式监控。设立了业务健康度模型,通过对父子业务间关系、业务与基础设施和后台资源间关系的结构化梳理,通过对多维度数据的采集计算,能够有效量化业务健康度指标。运维监控系统可自动实时对各业务进行健康度评分,实现对业务运营情况的科学度量,特别适合决策管理层人员了解业务整体运营情况。 1 系统功能 业务健康度和可用性的建模涵盖业务系统几乎所有的管理资源要素,包括业务单元、应用功能、系统服务和其它平台类资源,这些信息都要建立并实时更新于企业集中配置的管理数据库(CMDB)之中。基于CMDB动态调整实时CI项以及CI关系,通过结构化的模型框架,建立完整的业务CI项KPI指标体系,并绘制以业务为中心的系统地图。指标体系的建立要以业务为主线,按照业务——应用——平台的分层结构,针对每一层设定指标分类标准,并在这些指标基础上通过关系推导和加权计算实现业务监控的量化模型。 业务流程探针要能够直接模拟用户在系统中的业务操作,采集应用系统各功能模块的可用状态。其定时采集到的数据能够真实反映用户的操作体验,以及业务在后台各处理环节的性能。通过部署在用户终端模拟点的探针,可以很好地监控到这些模拟点的实际体验数据,实现业务流程操作全时段和全流程的横向全监控。 业务数据探针要从业务系统连接的网络交换设备中全程采集业务操作记录,第一时间采集到业务运营状态。利用旁路的业务系统数据包,经过业务包构造,对业务操作的量、时长、数据细节进行统计。同时,按照客户端IP、登录用户名等多维度对最终用户进行分类,及时监控区域性业务操作异常,保障业务支撑的正常运行,实现对业务流程操作在全地域、全用户的纵向监控。 2 系统实现 系统面向分布式应用实现,系统硬件环境根据网络和业务系统的规模来设定,业务探针介于业务系统和终端之间,所有终端对于业务数据的访问都必须经过探针服务器,终端必须安装插件,便于探针服务器进行检测。整个系统架构如图1所示。 2.1 监控 监控网站管理主要是对该系统的所有监控项目和监控点进行维护和管理。 应用管理是对该系统所有的监控项目进行维护,包括监控项目的创建、修改、删除等功能。应用管理模块显示了所有监控项目的信息,包括应用名称、访问地址、发生的故障次数以及平均响应时间。 监控点管理是对该系统所有的监控点进行维护,包括监控点的创建、修改、删除等功能。监控点管理模块显示了所有监测点的信息,包括监测点编号、监测点名称、监测点IP、备注等信息。 网站监控分析主要是对各监控项目及相应的监控点进行可用率、响应时间等的分析与统计,生成各种统计报表,直观地展示分析结果。 对网站监控来说,可用率包括两部分,一个是各个监测点的可用率,另一个是平均可用率,可用率的计算公式为: 平均可用率不是监测点可用率的平均值,是独立计算的,当所有监测点访问目标网站失败时,即认为网站出现了故障,用(总时间-故障时间)/总时间可以算出整体的可用率。 此处的可用率统计默认为该监控项目在当天的平均可用率,并按小时绘制了该监控项目在当天的可用率变化曲线;故障时间统计默认为对该监控项目当日的所有故障信息进行记录,显示了故障开始时间、恢复时间、故障持续时间、故障原因以及故障分类;失败原因统计默认对该监控项目当日的故障信息按故障原因进行分类统计,显示了各种类型故障的发生次数以及百分比,并通过饼状图直观地显示各故障类型所占的百分比。 同时,点击每日统计,可以查看该监

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档