网络故障预测及健康管理关键技术.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网络故障预测及健康管理关键技术

网络故障预测及健康管理关键技术   摘 要 近几年,随着科技的迅速发展,人们不管在生活还是生产上都离不开网络。网络涉及到工业生产、国防、教育、生活等方面。所以网络的管理尤为重要。为保证网络的正常运行,需要为其设置故障防御及管理系统。本文以网络故障预测与健康管理的系统设计为例,详细阐述在设置时的关键技术 【关键词】网络故障 预测 健康管理 关键技术 互联网已成为社会生活和工作的必需品,网络在运行中的各部分组成设备,如路由器、主机等日益增加,其功能在提升的同时,也加大了网络的管理难度。而网络设备的健康运行对整个网络系统有着至关重要的影响。因此,在网络的日常运行中,需要能?蛭?护网络正常运行,且在出现故障后能够迅速反应,准确定位故障发生环节,并排除故障的系统。这是目前网络维护和管理工作者的核心任务 1 网络故障预测与健康管理综述 网络的故障预测和健康管理(PHM)技术是作为实现网络设备基于状态的维修、自主式保障、感知与响应后勤等新思想、新方案的关键技术,也是一门新兴综合性交叉学科。故障预测和健康管理有两层含义:意识故障预测,即预先诊断设备或系统完成各自功能时的状态,确定设备正常工作的时间长度;另一方面是健康管理,即根据诊断或预测到的设备信息、可用资源和使用需求对维修活动作出适当决策能力。而网络故障预测与健康管理技术在设计上将传统的基于传感器的诊断转向基于智能系统预测,为准确而主动的维护网络正常运行提供了技术基础 在网络的故障预测和健康管理技术中,使用当前最新科技技术为基点,结合现下网络健康程度、特征等历史数据,收集与系统属性有关的各类设备运行参数,将这些参数和系统健康做关联,对系统进行检测、分析。对网络系统未来时刻的运行状态进行预测,便于在故障发生之前,能够采取有效措施保障网络的正常运行。为更直观地阐述网络故障预测与健康管理的关键技术。本文涉及网络设备的PHM系统,同时采用模块化设计,通过四个功能层次,实现网络设备故障预测与健康管理 2 故障预测与健康管理系统的设计 2.1 网络故障预测系统的设计要求 在设计故障预测与健康管理系统时,系统需要实现以下要求: (1)在故障预测与健康管理系统中的诊断环节,需要以网络管理系统所提供的警报信息为基础,通过SNMP模块接收设备警告,将来自网络系统中不同的运行设备放入警报信息转换为标准的、可识别的格式,存储到警报信息数据库中,对于故障警报信息将触发故障预测和诊断,对于数据库中的历史数据进行重新梳理分析。一旦发现故障模式,就会不断完善故障诊断信息库,为诊断故障累积“经验”,便于后期检测出同样故障时及时调出处理 (2)在系统中的诊断实施流程就是收集网络运行设备的性能的关键参数,对于参数预处理后进行合理的健康评估,再通过故障诊断方法对网络设备故障进行诊断和预测。系统中,此技术将诊断经验学习、累积和诊断的实施相互结合,互为补充,从而提高网络系统故障预测的可靠性和准确性,降低预测的误差 2.2 关键技术 网络故障预测与健康管理的关键技术从信息的收集、系统数据的处理、故障诊断与预测的技术、健康评估与管理等四个方面入手。详解如下: 2.2.1 网络设备运行信息的收集 在故障预测与健康管理系统中,利用系统的预测模型对收集到的网络设备运行状态信息进行分析和预测。故障预测和健康管理系统主要是将网络运行中的所有设备数据进行采集,在此过程中,为了减少通信的数量,需要选择对网络设备运行转台影响较大的参数量。比如网络设备的运行时间、系统运行时的温度变化、计算机CPU的最大利用率、内存的存储量、通信端口等对设备的运行状态影响较大的数据。以上几组变量可以反映设备的健康状态,因此在设计时,选用其作为预测模型的参数量 在设计之时,经过团队研究,提出五点研究假设: (1)网络设备的运行时间越趋近于或者超过发生故障的周期,系统认为发生故障的可能性就越大 (2)网络系统的运行温度越高,被认为发生故障的可能性就越高 (3)计算机CPU子运行时的利用率越高,被认为发生故障的机率就越大 (4)在计算机运算时的内存存储量越大,认为发生故障的可能性越大 (5)通信端口的丢包率、误码率越高,认为发生故障的可能性越大 提出五点假设后,系统的主要研究过程就围绕以上五点操作。同时在系统运行过程中,设备信息的收集时间间隔也比较重要。当收集的周期较短时,可以迅速发现设备的异常,更有利于维护网络的正常运行。但同时也存在缺陷,即在频繁的信息收集所占用设备和系统的有效资源,加重了系统运行的负担。当收集数据的周期较长时,数据量会比较少,对系统的负担小,但是不能及时发现并解决故障问题,对于网络系统中的突发状况不能及时作出响应。所以在实验系统的设计中,将系统数据收

文档评论(0)

docman126 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档