- 1、本文档共50页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE
PAGE IV
目 录
摘 要 I
ABSTRACT II
1 绪 论 1
1.1 研究背景 1
1.2 国内外研究状况 1
1.2.1 国外研究状况 1
1.2.2 国内研究状况 2
1.3 本文课题研究的目的和意义 3
1.3.1 本文课题研究目的 3
1.3.2 本文课题研究的意义 3
1.4 本文课题主要工作 4
1.5 本文课题创新点 4
1.6 论文组织结构 4
2 数据挖掘 6
2.1 数据挖掘概述及定义 6
2.1.1 数据挖掘概述 6
2.1.2 数据挖掘定义 6
2.2 数据挖掘过程 6
2.2.1 数据准备 7
2.2.2 数据挖掘 7
2.2.3 结果的解释和评价 7
2.3 数据挖掘的功能 8
2.4 数据挖掘的技术 9
2.5 数据挖掘的应用 10
2.5.1 数据挖掘科研应用 10
2.5.2 数据挖掘商业应用 10
2.6 数据挖掘对社会影响及展望 11
2.6.1 数据挖掘的社会影响 11
2.6.2 数据挖掘展望 11
2.7 本章内容小结 12
3 关联规则挖掘理论和算法 13
3.1 关联规则的基本概念 13
3.1.1 基本概念及定义 13
3.1.2 关联规则挖掘的过程 14
3.2 关联规则挖掘分类 14
3.2.1 布尔型关联规则和数值型关联规则 14
3.2.2 单层关联规则和多层关联规则 14
3.2.3 单维关联规则和多维关联规则 15
3.2.4 约束性关联规则和不带约束性关联规则 15
3.3 关联规则经典算法 15
HYPERLINK \l _TOC_250004 3.3.1 Apriori 算法 15
3.3.2 由频繁项集产生关联规则 16
HYPERLINK \l _TOC_250003 3.3.3 Aproiri 算法的缺陷 19
HYPERLINK \l _TOC_250002 3.4 优化 Aproiri 算法的方法 19
HYPERLINK \l _TOC_250001 3.4.1 基于 Aproiri 算法的优化 19
HYPERLINK \l _TOC_250000 3.4.2 不产生候选挖掘频繁项集—FP-gorwth 算法 20
3.5 基于约束的关联挖掘 20
3.5.1 约束的关联挖掘分类 20
3.5.2 规则约束性的关联规则的实现 21
3.6 关联规则发展趋势 21
3.7 本章小结 22
4 加权关联规则挖掘的研究 23
4.1 加权关联规则定义 23
4.2 加权关联规则的算法 25
4.2.1 K-支持期望 25
4.2.2 加权关联规则算法 26
4.3 加权关联规则的优化 29
4.3.1 水平权值归一化的加权关联规则的优化 29
4.3.2 其他的加权关联规则的优化 29
4.4 一种改进的加权关联规则及算法研究 30
4.4.1 问题的提出 30
4.4.2 水平加权关联及垂直加权关联规则 30
4.4.3 改进的加权关联规则相关定义 32
4.4.4 改进的加权关联规则算法及实现 34
4.4.5 MWAL 算法与其它算法比较分析与讨论 39
4.5 本章小结 40
5 总结和展望 42
5.1 主要总结 42
5.2 后续研究工作 42
致 谢 43
参考文献 44
附 录 47
作者在攻读硕士学位期间发表的论文目录 47
PAGE
PAGE 10
1 绪 论
1.1 研究背景
20 世纪 60 年代数据库技术在政府、商业部门和科研机构等广泛应用以来, 随着这些部门机构数据库的数据日益增长,传统的数据库技术仅限于对数据库的 查询和检索,不能从数据库中提取知识,使得数据库中所蕴含的丰富知识白白浪 费,如何在历史积累的大量数据中发现隐藏的规律或模式作为决策参考已成为迫 切需要解决的实际问题。因此必需寻求相应的数据挖掘工具,自动地从大量数据 中发现隐藏的规律或模式,为决策提供支持。在这背景下,数据挖掘是为了解决 这些问题而提出来的数据分析工具。
数据挖掘(Data Mining,DM)是指从大型数据库或数据仓库中提取隐含的、 先前未知的、对决策有潜在价值的知识和规则。数据挖掘技术是伴随数据库知识 发现(Knowledge Discovery in Database, KDD)研究中发展起来的。也有文献[2,6, 14]也把数据挖掘等同于KDD,认为数据挖掘更强调的是过程。实际应用中,人们 往往不严格区分知识发现与数据挖掘,一般在理论研
您可能关注的文档
- 加强我国高校纵向科研项目经费管理的研究-会计专业论文.docx
- 加强投资银行在企业并购中作用的对策研究-工商管理(MBA)专业论文.docx
- 加强投资全过程控制、形成我国投资监理特色-建筑与土木工程专业论文.docx
- 加强政治学科中的民族精神教育-学科教学(思想政治)专业论文.docx
- 加强普通高校高水平篮球队员人文素养的必要性研究-体育教育训练学专业论文.docx
- 加强普通发票管理对策研究——阜新市管理经验-财政学专业论文.docx
- 加强水产品质量安全管理提高水产品国际竞争力的研究-企业管理专业论文.docx
- 加强河北省农村留守妇女权益保护的研究-公共管理专业论文.docx
- 加强环境保护的财政政策分析-管理科学与工程专业论文.docx
- 加强未成年人思想道德建设的思考-学科教学论专业论文.docx
文档评论(0)