基于weka的数据挖掘的关联规则应用研究.pdfVIP

基于weka的数据挖掘的关联规则应用研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于weka的数据挖掘的关联规则应用研究

2015年 12月 机械设计与制造工程 Dec.2015 第44卷 第 12期 MachineDesignandManufacturingEngineering Vol_44No.12 DOI:10.3969/j.issn.2095—509X.2015.12.021 基于weka的数据挖掘的关联规则应用研究 董 婷 (榆林学院信息工程学院,陕西 榆林 719000) 摘要:以榆林市采气厂的采气监测数据为例,运用weka工具进行数据分析,并通过基于weka的 Apriori算法数据挖掘的关联规则应用,找出油压、进站压力、日产气量之间的关联,利用关联规则 分析其中存在的规律。实验结果表明,数据挖掘工具weka能够准确分析出各数据之间的关联情 况 。 关键词:关联规则;weka;数据挖掘;Apriori算法 中图分类号:TP391 文献标志码:A 文章编号:2095—509X(2015)12—0078—03 随着信息技术的发展,产生的数据量越来越 (support)、期望置信度 (expectedconfidence)和作 大,人们对于从数据中获取有效信息的要求也越发 用度 (1ift)4个参数来描述一对关联规则的属性。 强烈。数据库数量的日益增多,数据类型多样化、 1.2 关联规则的挖掘 结构复杂化的趋势越发明显,迫切需要先进的技术 在基于支持度一置信度框架中,同时满足用户 以满足人们的需求。数据挖掘 (datamining,DM) 给定的最小支持度阀值与最小置信度阀值的关联 技术正是基于人们对挖掘有效信息的需求而产生 规则称为强关联规则。关联规则的挖掘实际上就 的新技术。所谓数据挖掘就是从数据中发现趋势 是在事务数据库D中找出满足用户给定的最小支 和模式的过程 J。学术界对于数据挖掘进行了深 持度与最小置信度的强关联规则。 入的研究,取得了不菲的成绩,其中关联规则算法 的研究在数据挖掘算法的研究中占有举足轻重的 2 Apriori算法 地位,而关联规则算法的核心就是Apriori算法,目 挖掘关联规则的重点在于产生所有频繁集。 前对Apriori算法的研究也在逐渐增加 。 基本思路是,从 1项集开始找起,产生的候选项集 数据挖掘就是从多种多样的数据中发掘出潜在 经过最小支持度判断产生 1项频繁集,继续对 1项 的、有价值的、有规律的知识发现(knowledgediscov— 频繁集进行组合产生 2项候选项集,继续进行最小 eryindatabase,KDD)的过程 J,不仅如此,数据挖掘 支持度判断产生2项频繁集,依次类推,直至找到 还可以用于数据 自身的维护 。本文基于weka软 最大项频繁集。这里用到了Apriori算法的性质: 件对数据挖掘中的关联规则应用进行研究。 一 个频繁项集的任一子集也应该是频繁项集。 Apriori算法流程如图1所示。 1 数据挖掘 中的关联规则挖掘 Apriori算法实际上就是利用了Apriori性质在 1.1 关联规则主要概念、参数 不断地对事务数据库进行迭代扫描,直至产生出最 设 ,={i,i,…,i}是由几个不同的项 目组成 大频繁集的一种数据挖掘算法,在数据挖掘中具有 的集合,字母 表示 ,白勺子集,事务数据库用字母D 重要作用。 表示,T/D代表着一个事务,这个标识符有着唯一 性。设A是一个由项 目组成的集合,项 目A中包含 3 基于weka的Apriori算法数据挖掘的关 数个子项 目,用字母k表示,称之为k项集,项 目

文档评论(0)

haihang2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档