- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
--完美WORD文档DOC格式,可在线免费浏览全文和下载,是一篇优秀的毕业设计论文,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文的提供参考。
基于粗糙集的属性约简和核的快速更新算法研究
作者:钱文彬
导师:徐章艳
专业:计算机软件与理论
研究方向:数据挖掘
年级:2007 级
摘要
粗糙集理论是由波兰科学家 Z.Pawlak 在 1982 年提出的一种处理模糊、不精确知识和
不完备信息的数学工具。该理论的特点是不需要任何先验的知识,或者任何附加的信息,
就能有效地分析和处理这类数据, 从中发现隐含的知识,揭示潜在的规律性,即决策规则。
近年来,粗糙集理论在人工智能和认知科学领域具有重要的地位,特别是在知识发现、机
器学习、决策分析、过程控制、模式识别、数据挖掘和专家系统等领域得到了广泛应用。
在粗糙集理论中,属性约简和求核是重要的研究内容之一。属性约简,就是在保持知
识库(决策表)中分类能力不变的情况下,删除知识库中无关或不重要的属性,使得知识
库中的知识表示得到简化,而又不丢失其基本信息,如果能将冗余属性删除,则可以减小
知识库规模,节约成本,并能提高知识库中潜在知识的清晰度。由于对知识库进行属性约
简,很多算法都是以核为基础,然后在核的基础上逐步得到属性约简,因此,研究快速的
属性约简和求核算法具有重要的理论意义和应用价值。
目前,现有的大多数算法均是以静态决策表为基础而设计的,而针对动态决策表的算
法的研究较少,但实际决策表中的对象通常是动态变化的,故原来的核和属性约简可能已
经不再是新决策表的核和属性约简,为此需要对新决策表进行重新计算。在以静态决策表
为基础的属性约简和求核算法中, 对于更新后而变化不大的新决策表而言,将会使得原来
算法中大量有用的信息没有得到有效的利用,特别是对一些实时性要求较高的场合,这种
以静态决策表为基础的属性约简和求核算法往往不大适用,因此,研究高效的动态更新算
法具有广泛的实际意义。
本文首先简单介绍了粗糙集理论的研究动态和基础理论知识,然后系统地概述了现有
的基于决策表的常见属性约简和求核的模型及相关算法,其中包括基于正区域的算法、基
于差别矩阵的算法、基于信息熵的算法。本文在学习和借鉴已有研究成果的基础上,主要
的创新点如下:
1)利用位图和粒计算技术提出了一种改进的基于正区域的属性约简(Pawlak Reduction)
新算法。在该属性约简算法中,设计了一种能减少粒计算数目的启发式信息,有效地减少
了不影响属性约简结果的大量计算,并通过实例仿真和实验结果表明了新算法的有效性和
正确性。
2)给出一个简化二进制差别矩阵的属性约简定义,从理论上分析证明了该属性约简
的定义与基于信息熵的属性约简的定义是等价的。为求出简化的二进制差别矩阵,采用了
一个快速求简化决策表的算法。在此基础上,设计了基于信息熵的简化二进制差别矩阵属
2
2
3)分析了现有的常见求核增量式算法的不足,为了有效地提高动态决策表的核增量
式更新效率,本文首先引入简化决策表, 然后结合简化的二进制差别矩阵设计了一种新的
基于决策表的核增量式高效更新算法。该算法在更新简化的二进制差别矩阵时,只需在原
决策表基础上对记录进行相应的更新,不需要重复计算原决策表的二进制差别矩阵。采用
边更新简化二进制差别矩阵边计算核,显著地提高了动态更新核的效率和灵活性。算法的
时间复杂度和空间复杂度分别为 O(| C || U′ |) 和 O(| C || U?′pos || U?′ |) ,并通过实例仿真和实验性
能对比表明了新算法的有效性。
4)由于对决策表进行属性约简,很多算法都是以核为基础,然后逐步得到属性约简。
本文在 3)增量式更新核的基础上,利用位图技术,并结合简化的二进制差别矩阵设计了一
种新的基于决策表的属性约简增量式快速更新算法,算法的时间复杂度和空间复杂度分别
为 max{O(| Red || U pos || U′ |), O(| Red?? Core |2| U pos || U′ |)}和 O (| C || U pos || U?′ |) ,并用实例仿真说明了
新算法的有效性。
关键字:粗糙集、属性约简、核、增量式更新、算法复杂度
Research on Efficient Incremental Updating Algorithm for Attribution
Reduction and Computing Core Based on Rough Set
Editor: Qian Wenbin
Tutor: Xu Zhangyan
Major:Computer soft and theory
Major direction: Data Mining
Grade:2007
ABSTRACT
Rough Set theory, was proposed by Pawlak in 1982, which i
文档评论(0)