连续属性离散化方法与研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀硕士毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!

连续属性离散化方法研究 摘 要 实际数据库中存在较多的连续型数值属性,而现有的很多数据挖掘方法只 能处理离散型的属性,因而需要对连续属性进行离散化,因此,连续属性离散 化方法成为数据挖掘领域重要的基础性工作,直接影响到数据挖掘的质量。已 经出现了多种连续属性离散化算法,且各有特色和优劣。本文结合粗糙集合和 信息熵的相关概念,开展连续属性离散化研究,并提出一种新的离散化方法。 论文的主要工作如下: (1)综述了数据挖掘、信息系统和信息熵的基本理论,介绍了粗糙集合的 重要表示形式一一决策表,简述信息论的历史和发展,阐述了信息熵的基本概 念。 (2)系统分析了连续属性离散化的相关研究成果,并做了必要的比较。 (3)提出了区间类信息熵的概念结合粗集的有关理论,提出一种处理连 并从理论上对DICE算法进行了分析。 续属性的离散化算法一一DICE算法, (4)实现了本文提出的DICE算法,并以实际数据对DICE离散化算法与 C4.5自带的离散化方法进行比较,给出了实验分析结果并加以说明。 关键词:数据预处理,信息熵,粗糙集合,离散化。 0111theDiscrtizationofContinuousAttributes Study Abstract are Inthereal datarecords of attributeswith databases,the composedmany of continuous mostthe methodofdata are of value,since existing miningcapable withthediscreteattributesis todiscretizethecontinuous dealing only,itnecessary attributes totheabove—mentioned ofthe for firstly.Due fact,thestudy method continuousattributediscretizationbecomesan fundamentalworktothe important researchareaofdata can a influenceontheresultofdata mining,whichgivedeep kindsofmethodforthe miningprocess.Many continuousattributediscretization have has been one its and this proposed,everypropertiespriorities.Inthesis,some of setsandinformationare combinedto the conceptsrough entropy study discretizationofcontinuous

文档评论(0)

ygxt89 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档