基于rough+set理论数据挖掘模式.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于roughset理论数据挖掘模式

第22卷增刊 模糊系统与数学 V01.22.No.A andMathematics 2008年9月 FuzzySystems Sept..2008 set理论数据挖掘模式。 基于rough 王培吉1,白金牛2,赵玉琳3 (1.内蒙古科技大学理学院,内蒙古包头014010’ 2.内蒙古科技大学医学院.内蓑古包头014010; 3。内蒙古一机厂.内蒙古包头014000) 擅耍;敦据挖掘是数据库中知识发现的般心。用粗糙集[I】进行数据挖掘是被采用的一种新的有效方 击,但传统粗糙集分类方法过于严格.对噪音过分敏感。钟对信息的不确定性度数据中存在的嗓音,对基 set理论数据挖掘模式进行研究井提出改进的数据挖掘模式,用它可使分类更合理,约简更有 于rough 藏,抽取的规则更可信。 关键词;带不确定离子的决策系统;数据挖掘}扭耗案}属性约简 中圈分类号;0189 文献标识码;A 决策系统中,给定对象的确定属性值在一定程度上限制了对对象的表征能力,而不能体现对象的不 确定性和在决策中的重要度。为了能表征对象在决策系统中的不确定性和重要度,并且克服噪音的干 扰,在传统决策系统基础上,引入带不确定因子的决策系统。 1 带不确定因子决策系统 定义1.1 U (u。cD,{n}。∈c,tz,imp)为带不确定因子的决策系统,记为S,u是对象集。C是条 件属性集,D={d},d是带不确定因子产(o≤产≤1)的结论属性,产=1表示该元素对结论有完全肯 定的判断,即该元素所在等价类属于结论属性的正区czlpoS。(D),卢=0表示该元素对结论有完全否定 的判断,即该元素所在等价类属于结论属性的负区NEGB(D),否则该元素所在等价类为边界;{E}。ec 元索在.s中的重要性。卢、imp由领域知识及数据库操作得到。 处于边界的等价类其元素的结论属性值不唯一,这种情况可能是由于噪音的缘故,在传统租糙集模 式下由于噪音而丢失一些知识,为了克服这种缺陷,在带不确定因子的决策系统中,对处于边界的等价 类采取以下筛选步骤决定是否放入正区:①若该等价类中支持某一结论的元素个数在该等价类中所占 比例大于门槛值,则保留该等价类;◎对被保留的等价类,根据结论属性值及元素个数分别赋予一不确 定因子产和重要度imp(如可将条件属性下每一等价类元素个数作为该对象的重要度imp)。然后按定 义1.2决定是否放入正区. sC,X、Y 定义1.2在S中,B 乙lm轨 25im轨 ·收稿日期z2008—04—13 作者简介,王墙吉,男。内蒙古科技大学理学院剐教授,研究方向t计算机应用软件,信息管理系境. 增刊 set理论数据挖掘模式 王培吉.白金牛等:基于rough c c 划人负区的误差水平分别记为郎,.即:夕(X)≤昂时,XPOS。(D);以(y)≤“时,y Ⅳ量’GB(D)。 决策系统中,每个条件属性对结论影响是不同的,有些条件属性即使缺少也不影响结论。那么如何 约简以求得到一个与原决策系统包含相同知识有一样决策能力的约简是最重要的。 2条件属性约简 定义2.1对S,在误差水平为部和&下,结论属性d对条件属性集合C依赖度Dep(C,D,品,) r, 是芸被划入正区POSc(D)和Y划入负区NEGc(D)中元素重要度的和-7所有元素重要度之比。 郎,“),称a为B中可省略的,否则n为B中不可省略的;当所有口EB在B中不可省略的,且Dep(B, D,酩,“)=Dep(C,D,岛,“),即D对B、C有相同

文档评论(0)

wannian118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档