- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀硕士毕业论文,完美PDF内部资料。支持编辑复制!!!
一种关联规则的高效增量式挖掘算法研究
摘 要
数据挖掘是当今人工智能和数据库研究方面最富活力的领域。数据挖掘是
指从大量的数据中发现潜在的、有用的知识的过程。关联规则数据挖掘则是数
据挖掘的一个主要研究内容。而频繁项目集的发现是关联规则数据挖掘的核心
问题。
关联规则挖掘算法在整个关联规则挖掘中占有十分重要的地位。只有一个
好的算法才能保证挖掘具有良好的性能。事实上,对关联规则挖掘的研究首先
是对关联规则挖掘算法的研究,挖掘算法的效率直接影响着关联规则挖掘的应
用。
关联规则挖掘的经典算法,其核心思想是基于两阶段频繁项目集理论的递
推方法,尽管经过不断的改进,但是基于这一思想的算法不可避免的会遇到两
个不可克服的问题:过多的中间候选频繁项目集和重复扫描数据库,这导致算法
的效率不能适应某些场合的需要。
本文首先对数据挖掘作了讨论,包括数据挖掘的概念、数据挖掘的理论基
础、数据挖掘的主要问题和数据挖掘的分类等。然后,对关联规则挖掘算法做
了深入的研究,分析总结了关联规则中经典的Apriori算法及其改进算法(FUP)。
为了使在增加新的数据后,能够充分运用以前挖掘到的知识来提高挖掘的效率,
首先提出了一个新的概念—敏感度。然后从敏感度和时间效率出发对增量式更
新算法进行了改进,并通过一个实际例子对改进算法和原算法(FUP)做了分析和
比较。最后通过实验对改进算法的性能做了比较分析,其优点是能较好地发现
新增数据中的新模式,在挖掘过程中显示了良好的空间和时间性能,并具有较
高的敏感性。
关键词:数据挖掘;知识发现;关联规则;算法;频繁项目集
1
一种关联规则的高效增量式挖掘算法研究
Abstract
Data Mining is one of the most active research fields, especial in the fields of
artificial intellegince and database reasearch. Data Mining is a kind of process that
reveals potential useful knowledge from massive data. The association rule mining is
a main research aspect of data mining. And the discovery of the frequent item sets is
a key problem of the association rule mining.
Algorithms of association rules play a very important role in mining association
rules. Only a good algorithm could guarantee good performance to mining . In fact,
the study of mining association rules is the study of the algorithms. At first, the
efficiency of the algorithm affect the application of association rules directly.
The essential point of classical algorithms for mining association. rules is based
on the circular method of Frequent Itemset Theory.But this sort of algorithms sufers
ineluctably from the following two nontrivial costs:handling a huge
文档评论(0)