- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
增量式粗糙集属约简算法的研究
摘 要
粗糙集理论是波兰数学家Z.Pawlak提出的一种可用于处理不精确性、模糊性
和不确定性的有效的数学工具。其特点是在无先验知识或者附加信息的情况下处
理数据。粗糙集在数据挖掘、知识约简等方面有很好的应用前景。
属性约简是粗糙集理论的核心内容之一,其能够在保证系统分类和决策能力
不变的前提下对数据库中的冗余属性进行约简,简化知识表示,提高系统处理的
效率,方便用户决策。由于信息系统在对象、属性变化时,需要得到更新后的信
息系统的属性约简,这样,对于增量式粗糙集属性约简算法的研究慢慢开展开来。
本文通过对增量的粗糙集求核以及属性约简算法进行深入研究,主要的研究
内容如下:
(1)提出了一种改进的基于正区域的决策表增量属性约简算法。首先计算原
决策表与增量决策表的等价类、核、J下区域等信息。其次通过分析,原决策表以
及增量决策表的等价类与新决策表的等价类关系,得到新决策表的等价类;分析
原决策表的正区域信息,增量决策表的正区域信息,得到新决策表的J下区域等信
息。最后根据上述的条件作为基于正区域的决策表求核。在新决策表核属性集合
的基础上,使用属性重要性算法对决策表进行属性约简。
(2)提出了一种改进的基于信息熵的决策表增量属性约简算法。首先将决策
表划分成多个小的同构的决策表,然后对各个同构决策使用基于信息熵的算法求
核,最后通过对原决策表与各同构决策表在属性约简之间核,等价类等的关系,
整合得到整个决策表的属性约简。
关键词:粗糙集;属性约简; 增量; 信息熵
ABSTRACT
set Wills Polishmathematician
Roughtheoryproposedby Z.Pawlak,thistheory
wasmadeofa and ofan
effectivemathematical
non-precision,ambiguityuncertainty
t001.The of
this donotneed oradditional
advantagestheory prioriknowledges
ithasa indata
informations,and
goodapplicationprospects
reduction,etc.
Attributereductionone
is ofthecore Canensuretheclassification
contents,which
and underthe ofconstantreductionofredundant
decision-makingcapacity premise
attributesina the the
database,tosimplifyknowledgerepresentation,toimprove
of convenience of
efficiencysystem
processing,the
attributesorobjects ofinformation needto anew
changing system,peopleget
attribute
文档评论(0)