- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于实例推理配置中相似性研究
基于实例推理配置中相似性研究
摘要 基于实例推理的智能配置检索文法应先确定特征相似度量算法,首先,要找出最能反映本质特征的重要属性,即对实例特征属性集进行约简;其次,约简后的特征集中各属性的重要性又各不同,用粗集理论可以为特征集中的特征分配合理的权重值。
关键词 CBR;相似元;相似权重;特征集;属性依赖性
中图分类号TP391.1 文献标识码A文章编号 1674-6708(2010)20-0038-02
推理理论和文法在解决实际问题的应用是当前的一个研究热点,基于实例推理(Case-Based Reasoning,简称CBR)的基本思想在于从以往的成功设计中寻找与当前问题最为接近的实例作为问题的初始解,并经过对旧的实例的调整,使之满足新问题的要求,从而生成一个当前问题的解。由于基于实例推理与传统的基于规则推理的方法主要区别在于寻找问题解的过程中直接从以往设计中吸取经验,而不是通过把知识归纳成问题求解的一系列规则,依靠一定的事件去触发规则来搜索、产生问题的解。然而许多问题领域――譬如机械系统设计的方案设计问题的这种规则的归纳和提取具有很大的难度,使之成为基于规则推理系统实现的一个瓶颈,基于实例推理的文法的实现为克服这不足提供了可能性。
通常用距离测度法进行最相似实例的评判,这种相似度量的计算方法没有从系统的组成要素及相互关系角度出发进行系统分析,忽视了组成要素的特性的相似性,导致算出的相似系数不能很好地反映实例的相似程度,而相似学经过长期研究,形成了完整的相似理论和方法,并用数学公式比较准确地刻画了两个相似系统之间的相似程度。本文直接采用相似学中的相似度计算公式算出新问题和实例库中所有实例的相似度,再由相似度排序进行最相似实例的检索,这种方法简单有效。但在相似度量时,特征属性的权重值一般在实际中很难确定,通常是在先验知识的基础上通过事先假设或是采用平权的办法来处理,这种权重值的处理方法都无法证明其正确性,无疑会给最相似实例检索的准确性造成影响,必须先解决这个问题,这就要用到粗集理论,对特征集进行约简。粗集(Rough Set)理论是从知识分类的角度出发的一种新的数据推理方法,主要用于知识的约简和属性依赖性的分析。用粗集理论处理相似度量中属性权重值问题,可以不用事先假定的信息,只利用已有的信息来判断所有的属性,在特定的分类下是否具有同等的重要性,某个特征性的重要性也就是重要程度该特征属性在相似配置中的权重。
1 系统相似及相似度
相似学并不是现代产生的,早期人们在探索自然规律的过程当中,就已经逐渐形成了研究相似现象的方法和理论。牛顿、柯西(Cauchy)等都曾把相似模型成功的应用于工程问题。相似三定理则奠定了相似理论的理论基础。周美立在《相似学》、《相似系统论》两部著作中,建立了新的学科――相似学(Similology),研究自然界中相似现象的本质,相似性形成原理和演变动力,系统相似的一般规律及其应用。相似学的基本概念定义:相似要素指两个或两个以上系统间存在着共有属性或特征,在数值上存在着差异。将这些共有属性和特征称为相似属性或相似特征,通称为相似要素。
相似元:系统间存在一个相似要素,便在系统间构成一个相似单元,简称相似元,计作:
通过计算相似元的数值量化相似要素的相似程度。设A、B两个系统间某个相似元具有m个特征,计Uj(ai)为要素ai对于第j个特征的特征值,Ushy;j(bi)为要素bi相对于第j个特征的特征值。其比例系数,其中各特征值可以为确定的数,也可以为一个模糊数。
相似元的数值: (1)
式(1)中ui为系统间第i个相似元,wij为第i个相似元中第j个特征的权重。
相似系统A、B间的相似程度则由相似度QA-B表示,相似度的计算公式为:
式(2)中:k,l――A、B系统的要素个数;n――相似元的个数;――第i个相似元的权重。式中项表示系统间相似元个数对系统相似度的影响。项表示第i个相似元数值对系统相似度的影响。
2 特征集的约简(粗集理论的应用)
分析基于实例推理的实例检索是根据新问题的描述进行模式匹配的过程,新问题常常被定义成一组特征属性,检索的目标就是从相似实例库中找出一个最相似的实例。其检索过程是先根据新问题的初始条件中提取特征属性作为检索目标,再用新问题的特征属性值和相似实例集中的每个实例对应的特征属性进行相似度量,算出相似度的大小,找出相似度最大的实例就是最相似的实例。
相似度量时实例的各特征属性所起的作用是不同的,有的起关键作用,有的作用很小,甚至不起作用,而且这种作用的重要性会随着分类的改变而变化。在进行某一分类检索时,利用粗集理论能够算出实例属性重要程度,并且可以根据这种重要程度对
原创力文档


文档评论(0)