不可能即排除准则在缺失值情况下分类的研究及在数据挖掘中应用.pdfVIP

不可能即排除准则在缺失值情况下分类的研究及在数据挖掘中应用.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要 摘 要 近年来,分类尤其是缺失值情况下的分类,成为数据挖掘研究的热点。本文在研究了 国内外在缺失值情况下分类的昂新进展后,提出了-3+全新的分类思想。文章主要内容 包括以下几个部分: 首先,介绍了现有的主流的分类模型一一贝叶斯网络和决策树(C4.5算法),以及这 些模型针对缺失值情况的改进算法一一EM算法、SASC、SACMB,并讨论了它们对缺失 值的不同的处理方式。 而是通过排除可能性较小的候选类标来缩小选择的范围。为了表述的方便和保证IEC在逻 辑上的正确性,给出相关概念的形式化定义和定理证明。 with 再次,提出了以IEC思想为核心的新的分类算法CLassification Impossibility— Excluded Criterion(CLIEC),给出算法描述并对算法的各个部分进行了说明。 withUniversal 随后,提出了称之为Discretization Gravitation(DUG)的离散化算法。 该算法借鉴了万有引力的模型,解决了单纯的CLIEC算法不能处理连续量的问题,并结 合实例对DUG加以介绍。 在UCI数据集的对比实验,则证明了在缺失值情况。[-CLIEC是分类准确率高而时间开销小 的有效的分类算法。 最后,1每CLIEC应用于实际的数据挖掘项目,其良好的效果表明算法具有相当的实际 应用价值。 关键字:数据挖掘,机器学习,分类,缺失值,不可能即排除准则,CLIEC算法,离 散化,万有引力模型,DuG算法 第1页,共63页 Abstract Inrecent and morefocrisesfromData fieldhavebeenon years,more Mining putclassifi. cationresearchthe in context.Withthelabored Missing—Value collectionmad ofthe analysis latest advanceson Classificationin Context、weanovelclassification Missing-Valuepresent isthe coreour is idea,which of thesis.The theframeworkofthethesis. following Asa state-of-the-artclassification as Network beginning,some models,such Bayesian andDecision somevariants Tree,and of to with them,createdcope values,are

文档评论(0)

zxli + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档