网站大量收购独家精品文档,联系QQ:2885784924

数据挖掘中关联则算法及应用的研究.pdf

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘中关联则算法及应用的研究

摘要 摘 要 如今,人们把握数据的能力在不断提升。面对海量数据,人们更加关注的是 隐藏在数据背后的重要信息,而非数据本身。数据挖掘满足了我们的需求,它是 帮助我们发现数据中重要知识的有利工具。关联规则是数据挖掘的一个重要分 支,挖掘出大型事务数据库中的关联规则对不同领域实际问题的解决起着非常重 要的作用。 本论文主要研究关联规则算法及其应用。首先,论文系统地阐述了数据挖掘 和关联规则中的相关理论知识,为研究内容的全面展开打下坚实的理论基础。其 次,论文通过指出经典的挖掘频繁项目集算法Apriori算法的性能瓶颈问题,即 多次扫描数据库以及可能会产生庞大的候选集,为新算法的研究找到入口。因此, 本论文对Apriori算法做了如下改进:首先从数据库布尔矩阵的角度来生成厶和 厶,打破了Apriori算法生成厶的固有模式;然后在证明结论“厶一,生成G的连 接步可用厶一,∞厶来代替厶一。ooL,..成立的基础上,再来改进k-候选集的集合 Cr(k≥3)的生成算法。 所以,综合上述工作本论文提出了Apriori算法的改进算法BMSLApriori Matrix Linked BMSL 算法(Boolean Simplified iroirpA.对过通先首。)法算 Apriori 算法的理论性分析,我们可以得知该算法不仅能够减少数据库的扫描次数以及一 定程度上避免庞大候选集的产生,而且还能够降低算法的时间与空间开销。然后, 我们又通过具体的实验进一步证明了BMSL Apriori算法的效率确实优于Apriori 算法和其他算法。最后,在较好的软硬件环境下并借助真实超市交易数据库中的 Server 部分数据,论文采用Microsoft 2005和VB.NET作为开发平台来构建 SQL 一个简单的关联规则挖掘系统,将BMSL iroirpA.,中成生的则规联关到用应法算 通过挖掘结果再次证明了该算法较Apriori算法和其他算法确实取得了不错的挖 掘效果。 图[24】表[4】参【60】 关键词:数据挖掘;关联规则;Apriori;FP—growth;BMSL_Apriori 分类号:520.60; 摘要 Abs仃act datais SOmass of to the Nowadays,thecapacitypeoplegrasp rising.Facing in than concernthe informationhiddenthedata the more veryimportant data,people itself.Datameetsour itisausefultoolto usfmdthe data Mining requirment,and help fromthedata.AssociationRulesare branchofData knowledge important important the services all AssociationRulesof Database Mimng,andexcavating

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档