- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2012年第 2期 福 建 电 脑
不一致信息系统的属性约简方法研究
杨常清 .高 尧 2
(1、西安航空技术高等专科学校 陕西 西安 710077 2、陕西省科学技术信息研究所 陕西 西‘安 710054)
【摘 要】:针对不一致信息系统寻找解决方法,并证明算法的有效性。使用转化算法,将不一致决策表
转换为一致决策表 .本文使用三种方法转化 ,并对三种方法进行分析和比较 。理论上证 明了算法的有效性 ,
并使用UCI机器学习数据库对算法进行了测试和分析。本文所述算法,不仅可以处理不一致信息系统,对
一 般 的信息系统也是适用的.而且在运行效率上有所提高。
【关键词】:不一致 粗糙集 属性约简 信息系统
0引言 息系统DS=U,CUD,V,p中,如果POSc(D)=U,则称DS
粗糙集理论 (RoughSet.RS)m是一种处理含糊不确 是一致决策表或一致决策信息系统:否则称为不一致
定信息的新型数据分析工具。能够定量的分析处理不 决策表或不一致决策信息系统 。
确定、不严密、不完全的信息。在知识发现过程中,数据 1.2基本定义
源是大量的、含有噪音的、真实的。所发现的信息和知 定义1关系
识是潜在的隐藏在大量数据背后 的,是用户感兴趣 的、 集合X与Y的笛卡儿乘积的任意一个子集 .就是X
可理解的、可运用的知识回。因此 。在属性约简过程 中, 到Y上的一个关系
人们面临如何处理数据信息不确定性 问题 .从复杂的 (1)等价关系:当关系R满足 自反性、对称性、和传
不确定信息中获得符合实际需要的不确定性命题规 递性时,关系R称为等价关系。
则 。 f2)等价类 :所有与元素a具有等价关系的元素构成
粗糙集理论是一种不需要数据集合提供额外先验 的集合 ,称为a所生成的等价类。记为 a【]。即 a【】=
信息的数学工具[21,因此具有强大的优势。属性约简问 {xlx∈X,aRx}。
题 .作为粗糙集理论研究的核心问题之一 .在信息处理 集合X的等价关系R具有下面的性质 :
中起着关键 的作用[31 对于所有的xy∈X,或者 [xJR=[yl,或者 x【】n[y】
目前 .很多学者们 已经提出了一些有效 的属性约 =P‘,或者u[x]=u。
简算法f4jM.但这些算法都存在一定问题。应用于完备
定义2不可分辨关系 信息系统S=U,Q,V,p。对于
决策系统的约简算法 .在完备性和效率方面都没有很
每个属性子集AcB.定义一个不可分辨 的二元关系
好的解决方案;应用于不一致信息系统的约简算法 ,基
本上是基于可辨识属性矩 阵,其时问复杂度较高 。因 IND(A)={(,y)l(x,)∈UxU:Vq∈Ap(x,q)=(j,,9)}
IND(A)是一个等价关系。由这种等价关系导出的对U
而.为 了从复杂的不一致信息系统 中获得符合实际需 T T
要 的不确定性命题规则 .必需从更多方面研究不一致 的划分记为— .其 中包含样本x的等价类记为
IND (Al
信息系统的属性约简问题
[x]IND(A)o
1、理论基础
定义3上下近似集合 上近似集合和下近似集合是
1.1基本概念
粗糙集分析数据的两个基本概念。设X为论域U的一个
概念l
文档评论(0)