- 1、本文档共72页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多维关联规则数据挖掘在税务数据分析中的研究与应用
摘要
关键词:数据挖掘,关联规则
ABSTRACT
目录
TOC \o 1-3 \h \z 第一章 绪论 6
1.1论文研究背景及意义 6
1.2国内外的研究现状 7
1.3 论文研究内容 9
1.4 论文的结构 9
1.5 小结 10
第二章 关联规则概述 11
2.1 关联规则的基本概念和问题描述 11
2.2 关联规则分类 13
2.3 经典的关联规则算法分析 13
2.3.1 Apriori算法的理论基础 14
2.3.2 Apriori算法分析 15
2.4 遗传算法 15
2.4.1 遗传算法的生物学理论 15
2.4.2 遗传算法的工作过程 16
2.4.3 遗传算法的基本原理 17
2.4.4 遗传算法特点 19
2.5 蚁群算法 20
2.5.1 蚁群算法生物原理 21
2.5.2 简单蚁群算法描述 21
2.5.3 蚁群算法的特点 23
2.6 小结 23
第三章 基于遗传和蚁群算法的多维关联规则挖掘算法 24
3.1问题提出背景 24
3.1.1 遗传算法挖掘多维关联规则 24
3.1.2 遗传算法挖掘关联规则不足 26
3.2遗传-蚁群关联规则挖掘算法设计 26
3.2.1改进的总体设计思路 26
3.2.2 问题空间表达 28
3.2.3 信息素的表达和更新 29
3.2.4 蚁群路径的选择 30
3.3遗传-蚁群多维关联规则挖掘算法实现 32
3.3.1 算法的基本步骤 32
3.3.2 参数设置 35
3.3.3 算法分析 37
3.4 实验结果和分析 39
3.5小结 43
第四章 启发式的多阈值多维多层关联规则挖掘算法 44
4.1 多维多层关联规则阈值策略 44
4.2 问题提出背景 47
4.3启发式的多阈值多维多层关联规则挖掘算法 48
4.3.1 改进的多阈值策略设计 48
4.3.2 启发式多阈值多维多层关联规则的定义 49
4.3.2搜索策略 50
4.3.3 算法的步骤 50
4.4 关联规则的价值衡量的方法 52
4.4.1 客观评价方法 53
4.4.2 主观评价方法 53
4.4.3 综合评价方法 54
4.5 算法实验结果与分析 55
4.6 小结 56
第五章 税务决策分析(数据挖掘)原型系统设计与实现 57
5.1 税务系统数据挖掘的意义及目的 57
5.1.1我国税务系统信息化发展概况 57
5.1.2税务系统决策分析应用数据挖掘的必要性 58
5.2 系统总体设计 59
5.2.1 系统的总体设计原则 59
5.2.2 系统的框架 59
5.2.3 软件的开发环境 60
5.3 系统的数据库设计 61
5.4 模块设计与实现 64
5.4.1 预处理模块设计与实现 64
5.4.2 数据挖掘模块设计与实现 67
5.4.3 结果显示模块设计与实现 67
5.5 挖掘实例介绍和与结果分析 68
5.6 小结 69
第六章 结论 70
第一章 绪论
1.1论文研究背景及意义
随着计算机、网络、通讯等信息技术的高速发展,信息处理在整个社会规模上迅速产业化,企业和政府事务电子化的迅速普及都产生了大规模的数据,日益成熟的数据库系统和数据管理系统为这些海量数据的存储和管理提供了技术保证;另一方面,计算机网络技术的长足进步和网络规模的爆炸性增长,也为数据传输和远程共享交互提供了技术手段。伴随着数据的爆炸式增长,数据库中保存了大量未被开发利用的各个时期、各种系统遗留历史数据,这其中蕴含了大量的人们没有发现的信息和知识,如何快速、准确地从海量的数据中抽取出模式、找出数据变化规律和数据之间的相互依存关系,使人们能够从宏观的高层次的角度来审视数据,充分发掘数据潜力,指导人们的行为,为决策和科学发现提供有力的支持的问题被提出。
数据挖掘(Data Mining)就是为了解决这样的问题而被提出的。数据挖掘是20世纪90年代中期兴起的一项新技术,它是知识发现过程中的关键步骤。所谓数据挖掘就是从数据库中抽取隐含的、以前未知的、具有潜在应用价值的信息过程,自从被提出以来,它已经引起了学术界和工业界的广泛关注,还吸引了大批的研究者和开发者。这一学科是数据库技术、机器学习、人工智能、统计学、知识获取等多学科的交叉的产物。
关联规则(Association
文档评论(0)