基于数据挖掘的设备状态监测和故障诊断伍星.docx

基于数据挖掘的设备状态监测和故障诊断伍星.docx

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于数据挖掘的设备状态监测和故障诊断伍 星 陈 进 李如强 陈一鸣(上海交通大学振动、冲击、噪声国家重点实验室,上海 200030)会议召开,2002年7月,在加拿大Alberta的Edmonton举办了第8届KDD国际会议。1.2数据挖掘的过程模型数据挖掘是一个涉及大量不同技术和知识的创造性过程。在实施数据挖掘之前,需先确定采取的步骤和将达到的目标,有了好的计划才能保证数据挖掘有条不紊地实施并取得成功。从1992年Frawley J和Piatetsky等人第一次提出数据挖掘系统原型后[9],1996年Brachman等人进一步提出了以用户为中心的处理过程模型[10-11]。到目前为止,已有很多人对数据挖掘的过程模型进行过归纳和总结,其中最具权威的应该是Fayyad etal(1995)[12],Fayyad、Piatetsky&Smyth(1996)[13]以及Simoudis(1996)[14]给出的描述。另外需要指出的是,现在很多文章中提到1997年3月斯坦福大学的George H.John在其博士论文中给出另一种过程模型[15],其在内容上与前面提到三种处理模型并没有本质的区别。与此同时,由于商业利益的驱动,很多软件供应商和数据挖掘顾问公司也相应地提出了一些数据挖掘过程模型,来指导他们的用户一步步地进行数据挖掘工作。其中最著名的是跨行业数据挖掘标准过程(CRISP_DM:CRoss IndustryStandard Process forDataMin-ing),此模型在Daimler_Benz AG和OHRA的项目中得到了实践和验证[16]。此外,还有SPSS的5A模型,SAS的SEMMA模型,PMML模型,Microsoft OLE DB模型,以及专业的数据挖掘技术咨询公司Two Crows提出的模型等等。在将数据挖掘技术引入到工业设备状态监测和故障诊断之前,应首先从故障诊断的角度对数据挖掘过程模型的四个主要阶段进行理解和描述,这样才能避免应用的盲目性。1)目标理解和定义:数据挖掘最适合于数据正在微弱水平上发生变化而普通人类专家却不能发现的应用。例如在设备状态监测和故障诊断领域,设备操作者可能对设备系统总体特性有很好的了解,但是设备零件的更新和加工对象的变化所引起的监测数据变化的实际知识却很难获得。2)建立挖掘数据集:此阶段一般划分成四个部分,数据选择、数据清理、数据变换和数据归约。由于监测系统得到的数据通常具有多样性、复杂性和海量性的特点,因此必须根据挖掘的目标,在监测数据库和历史数据库中选择相应的数据集,进行清理(如,填充空缺值或忽略等)、变换(如,平滑、聚集、概化等)和归约(如,离散化等)。为了提高挖掘结果的质量,这个步骤大概要花去整个数据挖掘项目80%以上的时间和精力[17]。3)数据挖掘(模型的发现):它是一个反复的过程,可以使用诸如规则学习、决策树、聚类等多种多样的统计和机器学习技术。为了保证挖掘到的模型具有较好的精确度和健壮性,应将挖掘数据集至少分成两个部分:一个用于挖掘模型,另一个用于评价模型。4)模型的应用:由于现实应用数据的不同,在海量数据的驱动下,模型会不断地在学习过程中更新,发现新的设备行为状态和故障模型,从而保证较高的诊断准确率。1.3数据挖掘工具的发展纵观数据挖掘系统产品由20世纪80年代的萌芽到今天的繁荣,可以把它总结为如下三个阶段:第一代数据挖掘系统出现在80年代,包含单一任务的研究驱动工具,包括:决策树工具(如C4.5)或神经网络(如SNNS)建立的分类器等。在1995年左右,数据挖掘公司开发了第二代数据挖掘系统。这些工具主要是实现了知识发现过程要求的多种类型的数据分析和数据清洗和预处理。例如,SPSS的Clementine,Silicon Graphics的Mineset,IBM的IntelligentMiner和SAS Institute的Enterprise Miner。商业用户的需求导致了90年代晚期出现了基于应用和解决方案的第三代数据挖掘系统,它们面向商业用户,直接解决特定的商业问题,隐藏了所有数据挖掘的复杂性。例如,HNC Software的Falcon,IBM的Advanced Scout,NASD Regulation的Advanced_Detection系统,MIT的DataEngine。到1998年,根据Herb Edelstein的调查[18-19],数据挖掘工具市场是 45million,比1997年有100%的提高。2 工程应用目前,在很多领域,数据挖掘都是一个很时髦的词,尤其是在如银行、电信、保险、交通、零售(如超级市场)等商业领域。而在工业设备状态监测与故障诊断领域的应用主要体现在三个方面:特征提取、状态识别和诊断决策。2.1特征提取设备故障诊断中最重

您可能关注的文档

文档评论(0)

xjj2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档