- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于用户体验的应用性能管理系统设计
摘 要
本文在详细分析了河南省电力公司信息系统运维现状的基础上,设计了一种新的基于用户体验的应用性能管理系统,借助网络系统承载所有业务流量的先天优势,利用流量镜像采集技术对网络流量进行可视化和精细化监控与分析,面向业务,从最终用户体验出发,对河南电力关键业务系统网络流量和应用性能进行实时监控,通过可视化的业务性能和网络性能关键监控指标,对影响业务的相关性能问题进行主动预警,快速识别潜在的风险。
【关键词】应用性能管理 可视化 用户体验
“业务正在不断的驱动着IT运维管理朝着以应用为中心发展,与此同时,应用也变得越来越难于管理。”―Gartner
目前,国内电力行业正处于高速发展阶段,业务量与日剧增。由于各种关键业务和应用都被承载在基础架构、WEB应用、中间件和数据库上,使得业务的复杂性和维护难度大幅增加。如何对这些复杂的业务系统进行有效监控和风险防范,保障关键业务的高性能和高可用性,以及如何对现有的运维流程进行优化,不断提升管理和运维水平已经成为目前数据中心急需探索和解决的重要问题。
1 河南电力现状
河南电力经过多年的努力,IT运维管理水平有了长足的发展。但是通过对近几年河南电力突发事件应急处置过程及案例进行分析和思考,可以看出在应用性能监控管理和突发事件应急处置方面仍然存在可以提升的空间:
1.1 缺少对用户真实体验的监控
对于用户的真实体验缺少系统的监控和数据支撑。河南电力现阶段的信息化建设,投入了很大精力在IT系统的建设和对IT基础架构的维护上,但即使部署了最先进的基础架构,并不间断地监控PC、网络、服务器、数据库等组件的性能,客户还是会偶尔抱怨系统运行缓慢。
1.2 信息高度不对称、突发事件处置效率仍需要提升
由于信息系统复杂,系统间关联关系强,涉及环节众多,而监控系统相对独立,一旦出现问题,网络、系统、数据库、应用分头查找原因,各自为战,事件处置缺少明确方向,一方面需要付出较多的沟通和定位问题的时间成本,另一方面导致事件处理时间过长,影响被放大。
1.3 故障原因定位存在取证难、效率低,甚至互相推诿的问题
由于缺少全面的监控,故障事后分析诊断条件不足,缺少故障现场溯源数据,大多情况下只能对设备日志、交易日志等进行分析,很难拿出有力的证据进行取证,另外即使有故障现场数据,问题分析人员面对海量的数据问题分析定位仍需要消耗较长的时间。
2 应用性能管理系统的设计与实现
2.1 系统设计
2.1.1 系统设计原则
系统总体设计需要满足未来的发展需要,既要安全可靠,不影响现有的网络和业务,又要具有一定的先进性。在架构设计和功能模块的划分上,应充分的分析和整合项目的总体需求和预期的目标,尽量遵循高内聚、低耦合的设计原则,既要保证各个模块的独立性,也要保证模块间联系的简单性和易扩展性。
2.1.2 系统架构设计
根据河南电力信息系统业务数量众多、个别业务系统的访问关系又非常复杂的特点,本文提出一种以网络和应用性能监控分析平台为核心,利用网络镜像数据包对网络和关键业务的性能进行实时监控与分析的应用性能管理系统。通过先进的智能告警技术,将告警信息发送给网管平台进行统一的管理和展现。网络运维人员,利用监控与分析平台对出现的故障进行快速的分析和定位。如图1所示。
2.1.3系统功能设计
根据河南省电力公司的网络环境的实际情况,利用多台流量汇聚设备,对多个机房、多个监控点的流量进行采集和汇聚,对流量进行分析、过滤处理后,按照一定的原则和要求,将过滤处理后的“干净的”流量输送给业务可视化监控分析平台。如图2所示。
2.1.4 监控指标设计
根据对应用系统性格的分析需要,系统的监控指标主要分为以下4种:
(1)网络流量指标:反映业务的网络流量及网络传输效率,包括丢包、包重传率、往返时间、重传延时等;
(2)网络性能指标:反映网络传输质量,包括包吞吐量、包流量、实际吞吐量、数据包净荷等;
(3)应用性能指标:反映应用性能,包括交互数、重置率、数据传输时间、响应时间等;
(4)页面性能指标:反映HTTP访问性能和访问效率,用户体验,包括服务器重置率、连接数、连接失败率、连接时间、连接请求数等;
2.1.5告警规则设计
基于监控设备性能的考量,从监控指标中甄选出最具代表性,最能及时反映业务运行质量的指标作为告警监控指标,设置相应的告警阀值,以下为系统选取的告警指标:
(1)服务器响应时间(Server Response Time)。
(2)服务器重置率(Server Reset Rate)。
(3)连接失败率(Con
文档评论(0)