- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章节5.3.1粗糙集
3) 在{a2,a3}中只能删除一个属性 即存在两个约简: 从实例计算可以看出,信息表的属性约简是在 保持条件属性相对决策属性的分类能力不变的 条件下,删除不必要的或不重要的属性。 一般来讲: 条件属性对于决策属性的相对约简不是唯一的,即可能存在多个相对约简。 5.3.1.3 属性约简的粗糙集方法 1.属性依赖度定义 信息表中条件属性C和决策属性D,属性D依赖属性C的 依赖度为: 其中 表示正域 的元素个数, 表示整个对象集合的个数。 的性质 ①若 =1,意味着 ,即已知条件C下,可将U上全部个体准确分类到决策属性D的类别中去,即D完全依赖于C。 ②若0 1,则称D部分依赖于C(D Rough依赖于C),即在已知条件C下,只能将U上那些属于正域的个体分类到决策属性D的类别中去。 ③若 =0,则称D完全不依赖C,即利用条件C不 能分类到D中的类别中去。 2.属性重要度定义 C,D A,C为条件属性集,D为决策属性集,a∈C ,属性a关于D 的重要度定义为: 其中 表示在中缺少属性a 后,条件属性与决策属性的依赖程度。 表示 C 中缺少属性a 后,导致不能被准确分类的对象在系统中所占的比例。 2. 性质 (1) ∈[0,1] (2)若 = 0,表示属性a关于D是可省的。因为从属性集中去除属性a后,C-{a}中的信息,原来可被准确分类所有对象仍能准确划分到各决策类中去。 (3) ≠0,表示属性a关于D是不可省的。 因为为从属性集C中去除属性a后,某些原来可被准确分类的对象不再能被准确划分。 3.最小属性集概念 大多数情况下,数据库中存在一些不重要属 性,我们希望找到一个最小的相关属性集,它 具有与全部条件属性同样的区分决策属性所划 分的决策类的能力。 从最小属性集中产生的规则会更简练和更有意义。 最小属性集定义: 设C,D分别是条件属性集和决策属性集,属性集 是C的一个最小属性集,当且仅当 并且 若P是C的最小属性集,则P具有与C同样的区分决策类的能力。 需要注意的是,C的最小属性集一般是不唯一的,而要找到所有的最小属性集是一个NP问题。 在大多数应用中,没有必要找到所有的最小属性集。用户可以根据不同的原则来选择一个他认为最好的最小属性集。 5.3.1.4 粗糙集方法的规则获取 通过分析U中的两个划分 和 之间的关系, 把C视为分类条件,D视为分类结论,我们可以得到下面的分类规则: (1)当E Yj??时,则有: rij: 和 分别是等价集Ei和等价集Yj中的特征描述。 ①当E Yj=Ei时(Ei完全被Yj包含)即下近似,建立的规则rij是确定的,规则的可信度 cf =1.0。 ②当E Yj?Ei时(Ei部分被Yj包含)即上近似,建立的规则rij是不确定的,规则的可信度为: CF= (2)当Ei Yj=?时(Ei不被Yj包含), Ei和Yj不能建立规则。 图示: Ei 和Yj 的上、下近似关系 5.3.1.5 粗糙集方法的应用实例 通过实例说明属性约简和规则获取方法。有下表的数据: ? ? C(条件属性) ? D(决策属性) U 头痛(a) 肌肉痛(b) 体温(c) 流感(d) e1 是(1) 是(1) 正常(0) 否(0) e2 是(1) 是(1) 高(1) 是(1) e3 是(1) 是(1) 很高(2) 是(1) e4 否(0) 是(1) 正常(0) 否(0) e5 否(0) 否(0) 高(1) 否(0) e6 否(0) 是(1) 很高(2) 是(1) e7 是(1) 否(0) 高(1) 是(1) 1.等价集下近似和依赖度的计算 (1)条件属性C(a,b,c)的等价集 由于各元组(对象)之间不存在等价关系, 每个元组组成一个等价集,共七个: E1{e1},E2{e2},E3{e3},E4{e4},E5{e5},E6{e6},E7{e7}。 (2)决策属性D(d
文档评论(0)