网站大量收购独家精品文档,联系QQ:2885784924

关联规则挖掘算法分析与应用-控制理论与控制工程专业论文.docx

关联规则挖掘算法分析与应用-控制理论与控制工程专业论文.docx

  1. 1、本文档共81页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
山东大学硕士学位论文摘 山东大学硕士学位论文 摘 要 本文在系统介绍数据挖掘相关知识的基础上,重点研究了关联规则挖掘算法 及其在税收领域的部分应用。 关联规则挖掘算法的关键是频繁项目集的计算,其典型算法是Agrawal等人 提出的Apriori算法,但它适合挖掘事务数据库中的单维关联规则,而税收数据 是基于关系数据库的,而且大多是多维的,为此,我们提出了一个基于数据立方 体的、适合税收数据的多维关联规则挖掘算法Multi_Apriori,并用一个税收应用 实例说明了该算法的执行过程。为了提高该算法执行效率,在此基础上,我们设 计了一个基于OLAP技术和约束的多维关联规则挖掘算法Up_Apriori,该算法仅 针对维间关联规则,特别适于从关系数据库中挖掘税收关联规则,应用该算法, 我们成功实现了税负数据的关联分析挖掘,有效协助了税务系统纳税评估工作的 开展。 关联规则挖掘算法的应用是多方面的,但效率永远都是关键,在Apriori算 法的基础上,我们设计并实现了一个改进的关联规则挖掘算法Sup 算法基于多次剪枝和分区搜索技术,废弃了Apriori算法中的HashTree数据存储 结构,而改用一维数组结构方式来存放候选项目集,并进行合理分区,从而提高 了搜索的效率。分析结果证明,在频繁项目集的计算上该算法效率大大提高。要 将该算法应用到税务系统,需要将税收关系数据集转换为事务数据集,利用上述 算法和方法,我们实现了税务稽查选案数据的关联分析挖掘。 关键词:数据挖掘,关联规则,算法,税收数据,税负分析 山东大学硕士学位论文ABSTRACT 山东大学硕士学位论文 ABSTRACT This ardde introduced some knowledge about data mining systemicly.In the base of it,we studied association rules mining and its applicating in tax domain mostly. 11le key of association rules mining algorithm is the counting of frequent itemsets.Apriori is a typical algorithm that is putde forward by Agraval.It is suitable for mining ingle-dimensional association rules from transaction databases.But tax data is stored telation datebase and it is multidimensional.Therefore,we summarized an algorithm of Multi_Apriori.111is altofithm is based on data cube and it suit to multidimensional tax data,In order to improve its efficiency,we designed an improved altoritllm of Up_Apriori.We may use this algorithm to realize association rules 111illing about tax budem data. The efficiency of altorithm is key forever.So,in this arfide,we designed a highly effective altofithm of Sup_Apriori.It applies many pruning and parfitional counting technology.It applies one—dimension array to store candidcate sets.The array is districted to suit searching.By this way,the efficiency of altorithm is improved highly.Useing this altorithm,we can mine association rules in tax database about axamination data. ent applicafion. Key words:data mining.as∞ciation ruIea。aIgotithm tax.tax burden anaIysi II 原创性声明和关于论文使用授

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档