- 1、本文档共51页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
覆盖粗糙集与目录检索研究
摘要
粗糙集理论是数据挖掘的一个重要工具,也是粒计算的分支之一。经典的粗糙集
理论是由波兰的Pawlak于20世纪80年代提出的。粗糙集通过不可区分关系(等价关系)
为不完全和不充分信息的处理提供了一套系统的方法。但是等价关系应用范围有限,
理论推广到覆盖广义粗糙集理论。近年来,不同的学者提出了多种覆盖粗糙集模型并
讨论了一些相关性质和相互联系。
本文在覆盖广义粗糙集的基础上,将覆盖粗糙集理论进行扩展,并运用到目录
检索中去。主要工作如下:
(1)归纳了学者提出的多种覆盖粗糙集模型,这些模型的主要差异在于上近似运
算和下近似运算的不同。
(2)针对覆盖空间约简后有可能还会存在的冗余情况,本文提出了含约简的概
念。
(3)在对划分的信息熵及相关定义的基础上,推广定义了适合于覆盖空问的信息
熵及约简和含约简中的相关信息表达。
(4)结合覆盖空间的结构实际,提出了结构化近似算子,并提出了多层覆盖空间
的概念。
(5)在多层覆盖空间的基础上,提出了目录树的概念,并讨论了目录树的约简、
近似运算等。
(6)结合目录检索系统的特点,实现了目录树的生成、更新和相关查询操作,并
给出了部分新的查询算子和相近度评价。
关键词:覆盖粗糙集;目录检索;含约简;结构化近似运算;多层覆盖空间;目
录树
AND
RESEf气RCHONCOVERINGROUGHSETTHEORY
CATAI,OGUESEARCH
ABSTRACT
set isoneofthe toolsfordata isalsoabranch
Rough
theory important mining,and
Pawlakin
of classicalset is Poland
granularcomputing.Theroughtheoryproposedby
1 set asetof methodsfor withthe
980s.Roughtheoryprovides systemic dealing
and information rela-
incomplete undistinguishablerelation(equivalence
inadequacy by
of isfinite.With the
tion).However,the relation extending
applicationrangeequivalence
informationwhichis toinformation
partition relation covering,
producedbyequivalence
et set
Zakowski thePawlakset tocoveringgeneralizedrough
a1.expanded roughtheory
文档评论(0)