- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE
摘 要
这些年来,人们利用信息技术生产和搜集数据的能力大幅度提高。面对海量数据,人们更加关注的是隐藏在数据背后的重要信息,而非数据本身。数据挖掘满足了我们的需求,它是帮助我们发现数据中重要知识的有利工具。关联规则是数据挖掘的一个重要分支,挖掘出大型事务数据库中的关联规则对不同领域实际问题的解决起着非常重要的作用。
本论文主要研究关联规则算法及其应用。首先,论文系统地阐述了数据挖掘和关联规则中的相关理论知识,为研究内容的全面展开打下坚实的理论基础。其次,论文通过指出经典的挖掘频繁项目集算法Apriori算法的性能瓶颈问题,即多次扫描数据库以及可能会产生庞大的候选集,为新算法的研究找到入口。因此,本论文对Apriori算法做了如下改进:首先从数据库布尔矩阵的角度来生成和,打破了Apriori算法生成的固有模式;然后在证明结论“生成的连接步可用来代替”成立的基础上,再来改进k-候选集的集合(k≥3)的生成算法。
所以,综合上述工作本论文提出了Apriori算法的改进算法BMSL_Apriori算法(Boolean Matrix Simplified Linked_Apriori算法)。首先通过对BMSL_Apriori算法的理论性分析,我们可以得知该算法不仅能够减少数据库的扫描次数以及一定程度上避免庞大候选集的产生,而且还能够降低算法的时间与空间开销。然后,我们又通过具体的实验进一步证明了BMSL_Apriori算法的效率确实优于Apriori算法和其他算法。最后,在较好的软硬件环境下并借助真实超市交易数据库中的部分数据,论文采用Microsoft SQL Server 2005和VB.NET作为开发平台来构建一个简单的关联规则挖掘系统,将BMSL_Apriori算法应用到关联规则的生成中,通过挖掘结果再次证明了该算法较Apriori算法和其他算法确实取得了不错的挖掘效果。
TOC \o 1-3 \h \z \u
HYPERLINK \l _Toc304312398 第一章 绪论 PAGEREF _Toc304312398 \h 4
HYPERLINK \l _Toc304312399 1.1 论文的研究背景 PAGEREF _Toc304312399 \h 4
HYPERLINK \l _Toc304312400 1.2 数据挖掘技术的发展历史及国内外研究现状 PAGEREF _Toc304312400 \h 4
HYPERLINK \l _Toc304312401 1.3 论文的研究意义 PAGEREF _Toc304312401 \h 6
HYPERLINK \l _Toc304312402 1.4 本文的组织结构 PAGEREF _Toc304312402 \h 7
HYPERLINK \l _Toc304312403 第二章 数据挖掘 PAGEREF _Toc304312403 \h 7
HYPERLINK \l _Toc304312404 2.1 数据挖掘的概念 PAGEREF _Toc304312404 \h 7
HYPERLINK \l _Toc304312405 2.2 数据挖掘的方法 PAGEREF _Toc304312405 \h 8
HYPERLINK \l _Toc304312406 2.2.1 统计方法 PAGEREF _Toc304312406 \h 8
HYPERLINK \l _Toc304312407 2.2.2 关联规则 PAGEREF _Toc304312407 \h 8
HYPERLINK \l _Toc304312408 2.2.3 聚类分析 PAGEREF _Toc304312408 \h 9
HYPERLINK \l _Toc304312409 2.2.4 决策树方法 PAGEREF _Toc304312409 \h 9
HYPERLINK \l _Toc304312410 2.2.5 神经网络 PAGEREF _Toc304312410 \h 9
HYPERLINK \l _Toc304312411 2.2.6 遗传算法 PAGEREF _Toc304312411 \h 10
HYPERLINK \l _Toc304312412 2.2.7 粗糙集 PAGEREF _Toc304312412 \h 10
HYPERLINK \l _Toc304312413 2.2.8 可视化技术 PAGEREF _Toc304312413 \h 10
HYPERLINK \l _Toc304312414 2.3 数据挖掘过程 PAGEREF _Toc304312414 \h 11
HYPERLINK \l
您可能关注的文档
- (毕业设计论文)邯郸市罗城头综合商住楼基坑支护设计(9m).doc
- (毕业设计论文)后桥三面攻丝机电控系统改造.doc
- (毕业设计论文)洪门水电厂教育培训管理制度.doc
- (毕业设计论文)后乡镇企业时期的村社区建设资金.doc
- (毕业设计论文)互联网络发展论文:IPTV标准面临的问题与发展建议.doc
- (毕业设计论文)互联网络时代大学生社会主义核心价值观教育实效性研究.doc
- (毕业设计论文)互联网视域下意见领袖舆论引导与公民权益保护分析.doc
- (毕业设计论文)护理-导乐式分娩对降低社会因素剖宫产率的影响.doc
- (毕业设计论文)护理-精神专科护理人力资源调查与分析.doc
- (毕业设计论文)护理专业-心血管疾病的护理.doc
- (毕业设计论文)几类与矩阵的秩有关的问题.doc
- (毕业设计论文)计算机外文翻译--图像分割(适用于外文翻译+中英文对照).doc
- (毕业设计论文)技术经济学概论之新型电池项目可行性研究报告.doc
- (毕业设计论文)技术管理工作在煤矿安全生产中的重要作用.doc
- (毕业设计论文)继电保护、绝缘、电测技术监督管理制度及实施细则.doc
- (毕业设计论文)绩效工资的实施与探讨.doc
- (毕业设计论文)计算机专业外文翻译--VisualC++MFC简要介绍(适用于外文翻译+中英文对照).doc
- (毕业设计论文)绩效管理论文理论基础论文.doc
- (毕业设计论文)绩效考评论文-加强路桥施工企业员工绩效考评的探讨.doc
- (毕业设计论文)绩效工资论文:论绩效工资制度在单位管理中的利与弊.doc
最近下载
- 2025年泡沫铝行业研究报告及未来发展趋势预测.docx
- 智慧城市应急管理信息化平台建设方案(47页).pptx VIP
- 班主任基本功大赛育人故事一等奖:从“心”擦亮星星的光.docx VIP
- (高清版)-B-T 41932-2022 塑料 断裂韧性(GIC和KIC)的测定 线弹性断裂力学(LEFM)法.pdf VIP
- 上海牛津英语5B知识点汇总.docx VIP
- 华为交换机配置教程(从入门开始)-华为交换机详细教程.pdf VIP
- 机械创新设计第七章 仿生原理与创新设计 .ppt VIP
- 高等教育心理学课件.ppt VIP
- ISO 55013-2024 资产管理-数据资产管理指南(中文版-雷泽佳翻译-2024).docx
- 发改价格〔〕670建设工程监理与相关服务收费标准.doc VIP
文档评论(0)