数据挖掘中关联规则算法及其应用研究.pdf

摘要 摘 要 如今,人们把握数据的能力在不断提升。面对海量数据,人们更加关注的是 隐藏在数据背后的重要信息,而非数据本身。数据挖掘满足了我们的需求,它是 帮助我们发现数据中重要知识的有利工具。关联规则是数据挖掘的一个重要分 支,挖掘出大型事务数据库中的关联规则对不同领域实际问题的解决起着非常重 要的作用。 本论文主要研究关联规则算法及其应用。首先,论文系统地阐述了数据挖掘 和关联规则中的相关理论知识,为研究内容的全面展开打下坚实的理论基础。其 次,论文通过指出经典的挖掘频繁项目集算法Apriori算法的性能瓶颈问题,即 多次扫描数据库以及可能会产生庞大的候选集,为新算法的研究找到入口。因此, 本论文对Apriori算法做了如下改进:首先从数据库布尔矩阵的角度来生成厶和 厶,打破了Apriori算法生成厶的固有模式;然后在证明结论“厶一,生成G的连 接步可用厶一,∞厶来代替厶一。ooL,..成立的基础上,再来改进k-候选集的集合 Cr(k≥3)的生成算法。 所以,综合上述工作本论文提出了Apriori算法的改进算法BMSLApriori Matrix Linked BMSL 算法(Boolean Simplified iroirpA.对过通先首。)法算 Apriori 算法的理论性分析,我们可以得知该算法不仅能够减少数据库的扫描次数以及一 定程度上避免庞大候选集的产生,而且还能够降低算法的时间与空间开销。然后, 我们又通过具体的实验进一步证明了BMSL Apriori算法的效率确实优于Apriori 算法和其他算法。最后,在较好的软硬件环境下并借助真实超市交易数据库中的 Server 部分数据,论文采用Microsoft 2005和VB.NET作为开发平台来构建 SQL 一个简单的关联规则挖掘系统,将BMSL iroirpA.,中成生的则规联关到用应法算 通过挖掘结果再次证明了该算法较Apriori算法和其他算法确实取得了不错的挖 掘效果。 图[24】表[4】参【60】 关键词:数据挖掘;关联规则;Apriori;FP—growth;BMSL_Apriori 分类号:520.60; 摘要 Abs仃act datais SOmass of to the Nowadays,thecapacitypeoplegrasp rising.Facing in than concernthe informationhiddenthedata the more veryimportant data,people itself.Datameetsour itisausefultoolto usfmdthe data Mining requirment,and help fromthedata.AssociationRulesare branchofData knowledge important important the services all AssociationRulesof Database Mimng,andexcavating

文档评论(0)

1亿VIP精品文档

相关文档