数据挖掘中的Tcl粗糙集扩展.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘中的Tcl粗糙集扩展 王缁奎黄厚宽宁云晖 (北方交通太学计算机科学系人工智能研究所北京 100044) 摘要相糙瘫为从关系数据障或豫黄表中抽取先前未知数据的相关性或操娜提供方法。现有一些应用和提供不同分析尊 法的低城库。但在许多实际应用中.恨难合并这一鼍低级库。为此.谖文引进了一个为Tel语言增加粗糙集扩展的方法n谤 扩展语言RSLTc|具有易于使用的界面及根太的二:括性.并用两个新开发的TcI命夸来说明该方法。另外还甩一个例子来 说喟如何用这些命令从决燕表中生成规则。 关键词:数据挖掘.粗桂集理论,Tcl.KSLTcl 中图法分类号:TPl8 用不可缺少属性从表的行中识别重大属性。 1.引言 租糙集方洼的关键思想在于分析对象子壤的 J 可识别界艰。圉X的下近似(10、m。approxJmatton 数据库知识发现(KDD)和数据挖掘(data 尼Ⅳ表示包含于X中的最大可定义集台:用x的 mining)[1]1舰速发展对应用产生了深刻的影响。粗 上近似(upp盯approximation)剃表示包含于X中 Set)f2,3】便是数据挖掘中用来分析不 糙集(iollgh 的最小可定义囊台。所以在租糙集中.只处理虽Y 完全或不确定信息的一种方法。不像模糊集和概率 和RY,而不是X本身。 论方法那样依赖于数据的外部模型.粗糙集分析仅 因为粗糙集强调属性的相关性,所以非常适用 依赖于数据的内部结构。在实际应用中.租糙集技 于数据挖掘。与属性相关性分析有关的问题是:冗 术经常用来从存储数据中产生能够预测值的规则 余条件识别和信息保存约简。另一个重要概念是属 集。 性的最小集(可理解为可咀用来代替所有有用属性 现有为粗糙集数据分析提供一系列核心算法 的一组属性)。因而主要问题集中在如何选择最佳 的低级库f41。然而,在使用返些库时需要数据的扩 约简。 展格式,井且在显示和存储结果方面不够灵活.该 2.2使用粗糙集方法的表约简 文引入一种使用具有担糙集扩展的Tcl语言方法,’ 不仅具有很大的灵活性而且容易实现。 将粗糙集方法用于数据挖掘时.可以通过约麓 在文章的其它部分先给出有关租糙集理论和 条件属性和决策属性集合推导出生成规则:榴糙集 方法与其它机器学习方法唯一不同的是:它允许不 Tel语言的基本知识,然后用最近开发的两个Tcl 命令来说明该新方法,另外还给出一个例子。 一致性井能用非常简单的方式处理不一致性.下近 似计算产生必然规则,上近似计算产生可能规则, 2.数据挖掘中的租糙集方法 2.3租糙集实例 2.1粗糙集基本概念 现在用表1中【5】的简单例子来说明用粗糙集方 法进行的规则推导。 粗糙集方法主要是由与约简(reduction)有关 的因素来驱动的。在用粗糙集对决策表(以属性为 由决策“感冒”生成的分类是: 行,以数据元素为列的表格)进行的分析中.约简 X={{0,l,3。5,6)t{2,4,7,8,9})

文档评论(0)

bhl0572 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档