数据挖掘技术中的关联规则挖掘算法的研究.pdf

数据挖掘技术中的关联规则挖掘算法的研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘 要 数据挖掘是伴随着信息量的迅速增长而诞生的,它是从数据中析取、识别和发现潜在 的、有用的、前所未知的、最终可理解的知识(规则或模型) 的过程。数据挖掘技术就是要在 已有数据中识别数据的模式,以帮助用户理解现有的信息,并在已有信息的基础上,对未 来状况做出预测。 关联规则挖掘是数据挖掘中的一个重要研究分支,主要用于发现数据集中项与项之间 的相关联系。Apriori 算法和FP-Tree 算法是关联规则挖掘中的经典算法,它们都是基于事 务数据库中的数据量不会发生变化和每个数据项都具有同等的重要性进行挖掘。但在实际 的应用中数据库中的数据是在不断发生变化的,并且对于不同的数据项人们的关注程度也 不尽相同。如果我们仍然采用传统的挖掘算法进行关联规则的挖掘,挖掘的效率将非常低 下,挖掘的结果也不够准确。针对这些问题本文进行了深入研究,主要工作和创新点包括: (1) 研究了布尔型关联规则挖掘算法—Apriori 算法,对该算法的基本思想和挖掘步骤 进行了归纳和总结。详细分析了算法的缺点,针对这些缺点讨论了各种改进措施。并且对 其中最具影响力的改进算法—FP-Growth 算法进行了详细的分析和研究。 (2) 提出了一种改进的增量式更新挖掘算法—AFUP 算法,该算法针对现有增量式更新 挖掘算法中对新增项目不敏感这一问题,引入了敏感度的概念用来衡量新增项目的敏感程 度。解决了传统增量式更新算法中无法发现新增项目集中潜在关联关系的问题,同时算法 效率也有所提高。 (3) 提出了一种新的加权关联关联规则挖掘算法—FPWAL 算法。与以Apriori 算法为基 础的挖掘算法不同,该算法以 FP-Tree 算法为基础,减少了数据库扫描次数,大大提高了 挖掘的效率。同时引入了水平权值和垂直权值的概念,使得挖掘结果也更加合理。 针对本文提出的两种算法都进行了实验验证,结果证明了算法的有效性、合理性和高 效率。同时,本文提出的算法也使挖掘结果更加符合现实需求。 关键字:数据挖掘;Apriori 算法;增量式挖掘;加权关联规则 I Abstract Data mining accompanied by the rapid growth of information, it was born in the process of data disjunctive, identification and then finding potential, useful, hitherto unknown, ultimately comprehensible knowledge (rules or model) in it. In order to help users understand the existing information, the data mining technology should base on the existing data to identify the data model, and make a forecast to future situation on the basis of the existing information. Mining of association rules is an important research in data mining, mainly used for data concentration items which related with each other. Apriori algorithm and FP-Tree algorithm is the classical algorithms in the association rule mining, they are based on the transaction database data will not be changed and each data items are equal

文档评论(0)

liybai + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档