粗糙集理论在数据挖掘领域中的应用控制科学与工程专业论文.docxVIP

粗糙集理论在数据挖掘领域中的应用控制科学与工程专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
粗糙集理论在数据挖掘领域中的应用控制科学与工程专业论文

浙江大学博士学位论文 浙江大学博士学位论文 V 摘 要 本论文的研究内容集中在Rough集理论以及Rough分析在数据挖掘领域 中的若干应用。Rough集理论是一种新型的处理不确定性知识的数学工具, 同绕着数据挖掘领域存在的问题,本文利用Rough集理论与Rough分析工具, 提出若干解决方案,同时在具体处理问题过程中引入了信息理论、网子分析 等方法,与Rough分析结合使用,讨论了Rough集技术在知识发现、关联规 则挖掘、模式分类以及数据清洗等问题中的应用。论文对数据挖掘以及Rough 集理论进行了基本概述,完成的主要工作包括: I.针对海量数据处理起来极为耗时,现有算法拓展性较差的问题,基于 Rough集理论中的集合正域概念以及由此定义的属性重要性概念,提出一种 大型数据表分解算法,现有的规则归纳算法可直接在分解得到的树型结构上 应用,将大大降低知识发现的时间,并从信息理论的角度利用信启。熵概念对 该分解结构进行了验证,分析了这种分解的实用性及合理性,揭示了这种分 解结构在提高计算速度的同时刁i会损失信息量。 2.针对关联规则挖掘过程中多次搜索数据表的问题。将Rough分析的等 效类概念引入到关联规则挖掘中,针对单维布尔关联规则问题提出一种挖掘 算法,同时针对单一的最小支持度阈值的缺点,提出使用多个最小支持度闽 值来进行频繁项集挖掘,可使得结果规则集合更加精练,包含更多的有意义 规则。利用兴趣度对规则进行评价是发掘有意义规则的重要方式,文中从主 观方面给出一种兴趣度评价方式以帮助用户发现更需要的规则。 3.提出一种属性选择和属性消减方法,引入因子分析技术对条件属性进 行分组,每个属性类内部的条件属性与相应的因子线性相关,所有因子是目 标概念的线性组合,根据属性类或属性是否与相对应的目标概念或因子强相 关,引入信息熵评价方式对之进行选择,选择出与目标概念相关的属性,剔 除无关的属性。 4.将属性选择方法与Rough分析相结合,利用Rou【gh分析可以剔除属 性集合中冗余属性并进行规则归纳的能力,提出一种基于Rough分析的分类 器建模算法。针对在对未知类别的对象进行预测时会遇到的多规则匹配与无 规则匹配问题,定义了部分匹配函数和灵活匹配函数,根据计算得到的函数 值决定未知类别对象的归属。 5.数据预处理是数据挖掘之前的必要准备步骤,针对数据预处理问题中 的缺失数据与重复数据的挖掘问题提出两种算法,首先针对缺失数据问题, 浙江大学博士学位论文利用Rough集理论通过对己知数据进行预测实现对缺失数据的填补,达到了 浙江大学博士学位论文 利用Rough集理论通过对己知数据进行预测实现对缺失数据的填补,达到了 一定的预测精度;然后针对重复数据问题,利用数据表分解技术阻及快速排 序方法实现重复数据的发现,并降低了重复数据的发现时间。 最后,对全文进行了概括性总结,并指出了有待进一步研究和完善的问 题。 关键词:数据挖掘,Rough分析,规则归纳,关联规则,分类,数据预处理 浙江大学博士学位论文 浙江大学博士学位论文 VII AB STRACT This dissertation focuses on applications of rough set theory and rough analysis in data mining.Rough set theory is a newly developed mathematical tool for dealing with uncertain knowledge.To solve some existed problems in data mining,the thesis gives out a few resolutions with the new mathematical t001. Information theory and multiple statistics are introduced into rough analysis together with rough set theory and other techniques,new results are giving for knowledge discovering,associative rules mining,pattem classification and data cleaning,etc.After a brief summary on data mining and rough set theory,the research works in the thesis can be deseript as follows: 1.T0 the problem that finding rul

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档