摘要
摘 要
如今,人们把握数据的能力在不断提升。面对海量数据,人们更加关注的是
隐藏在数据背后的重要信息,而非数据本身。数据挖掘满足了我们的需求,它是
帮助我们发现数据中重要知识的有利工具。关联规则是数据挖掘的一个重要分
支,挖掘出大型事务数据库中的关联规则对不同领域实际问题的解决起着非常重
要的作用。
本论文主要研究关联规则算法及其应用。首先,论文系统地阐述了数据挖掘
和关联规则中的相关理论知识,为研究内容的全面展开打下坚实的理论基础。其
次,论文通过指出经典的挖掘频繁项目集算法Apriori算法的性能瓶颈问题,即
多次扫描数据库以及可能会产生庞大的候选集,为新算法的研究找到入口。因此,
本论文对Apriori算法做了如下改进:首先从数据库布尔矩阵的角度来生成厶和
厶,打破了Apriori算法生成厶的固有模式;然后在证明结论“厶一,生成G的连
接步可用厶一,∞厶来代替厶一。ooL,..成立的基础上,再来改进k-候选集的集合
Cr(k≥3)的生成算法。
所以,综合上述工作本论文提出了Apriori算法的改进算法BMSLApriori
Matrix Linked BMSL
算法(Boolean
Simplified iroirpA.对过通先首。)法算 Apriori
算法的理论性分析,我们可以得知该算法不仅能够减少数据库的扫描次数以及一
定程度上避免庞大候选集的产生,而且还能够降低算法的时间与空间开销。然后,
我们又通过具体的实验进一步证明了BMSL
Apriori算法的效率确实优于Apriori
算法和其他算法。最后,在较好的软硬件环境下并借助真实超市交易数据库中的
Server
部分数据,论文采用Microsoft 2005和VB.NET作为开发平台来构建
SQL
一个简单的关联规则挖掘系统,将BMSL iroirpA.,中成生的则规联关到用应法算
通过挖掘结果再次证明了该算法较Apriori算法和其他算法确实取得了不错的挖
掘效果。
图[24】表[4】参【60】
关键词:数据挖掘;关联规则;Apriori;FP—growth;BMSL_Apriori
分类号:520.60;
摘要
Abs仃act
datais SOmass
of to the
Nowadays,thecapacitypeoplegrasp rising.Facing
in than
concernthe informationhiddenthedata the
more veryimportant
data,people
itself.Datameetsour itisausefultoolto usfmdthe
data Mining requirment,and help
fromthedata.AssociationRulesare branchofData
knowledge important
important
the services all
AssociationRulesof Database
Mimng,andexcavating
您可能关注的文档
最近下载
- 2026中国建设银行远程智能银行中心客服代表社会招聘200人(广州20人)参考考试题库附答案解析.docx VIP
- 儿童身高管理.pptx VIP
- 2026中国建设银行远程智能银行中心客服代表社会招聘200人(广州20人)参考考试试题附答案解析.docx VIP
- 2026至未来5年中国冲压端子市场数据分析及竞争策略研究报告.docx
- 《电梯触摸屏操控终端技术要求》.docx VIP
- 上海大学继续教育市场营销网课答案更新版.pdf VIP
- 2026中国建设银行远程智能银行中心客服代表社会招聘200人(广州20人)备考考试试题及答案解析.docx VIP
- 2026中国建设银行远程智能银行中心客服代表社会招聘200人(广州20人)考试备考题库附答案解析.docx VIP
- 2021 年全国一级建造师考试执业资格考试法规-白金卷.docx VIP
- 中国燃料电池汽车产业发展白皮书(2025年).docx
原创力文档

文档评论(0)