- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机科学2002Vo1.29N2,9(专刊)
基于先验知识的粗糙集属性约简
ImprovedReductionAlgorithmBasedonA-priori
胡清华 鲍 文 于达仁
(哈尔滨工业大学 哈尔滨150001)
Abstract Thepropertyofdataprocessingbasedonroughsettheoryisdiscussedinthepaper.Ingenerally,peo-
plewellknowtheproblemstheyaredealingwith.Theattributeswhichareimportantandwhicharevaluelessare
well-knowntotheengineers.Ifthesea-prioriareintegratedwiththedataprocessingtools,computingwillbere-
ducedgreatly.Basedontheidea,analgorithmisproposedbythemeansofman-computerinterconnection.Engt-
lsthecore坦 Theadvantageoftheimprovedalgorithmisverified
neerscanmarkedsomeattributesas intheprocedure
inthedocumentsclassfiication
Keywords RouRhset,Roughrules,Generalization,A-priori
的范畴。由于真实世界中的样本数据不可避免地存
I·引官 在噪声和数据丢失现象,尤其是当样本数据十分有
由波兰学者PawlakZ.于1982年提出来的粗糙 限而分类依赖的属性维数又很高的情况下,如文本
集理沦(RoughSetTheory)是一种处理不精确、不 分类,将这种极小规则集应用于决策时将会产生错
确定、不完备数据的数学工具,近年来由于在机器学 误。如何提高粗糙规则的泛化能力成为一个有待于
习、知识发现、模式识别、故障诊断、决策支持等领域 研究的问题.本文在介绍了基于粗糙集理论的知识
获得成功应用引起广大研究人员的关注.经过十几 发现的荃本概念之后.分析了影响粗糙规则泛化能
年来计算机科学领域和数学领域学者的不断努力, 力的一些主要因素,并提出了基于先验知识的粗糙
粗糙集理论已经从理论和应用上得到了广泛的研 规则改普算法.
究. 2.粗糙集理论的荃本原理
粗糙集理论是传统集合论的拓展,它建立于分
类机制的基础之上,将知识理解为在某种等价关系 2.1粗枯粼理论的墓本概念
下对特定空间的划分,利用上下近似(Upper-Lower 粗糙集理论处理的数据一般以表格的形式表
Approximation)两个集合,将知识库中的各等价集 示,称这种包含了条件属性、决策属性的样本集合为
合有效地组织起来。粗糙集理论与传统的集合论相 一个知识系统,记为:S=(U,A,VJ)有序组,其中
比,重新定义了集合之间的等价关系,利用粗糙集的 U={IIi,,z.)为研究的非空有限对象的全
概念描述知识的不确定。基于粗枯集理论的数据处 体,即论域:
理无需提供除处理问题所需的数据以外的任何先验 A=CUD是属性的全体,C表示条件属性,D
知识.因此对问题不确定的描述比较客观. 表示决策属性,CnD=O;
随着KDD的兴起,粗糙集理论被广泛应用于 V=UVV,是属性的值域;
-EA
文档评论(0)