网站大量收购独家精品文档,联系QQ:2885784924

2025年关联规则数据挖掘.doc

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

关联规则数据挖掘

學习汇报

目录

引言2

案例2

关联规则3

(一)关联规则定义

(二)有关概念

(三)关联规则分类

数据6

(一)小型数据

(二)大型数据

应用软件7

(一)WEKA

(二)IBMSPSSModeler

数据挖掘12

总結27

引言

数据库与互联网技术在曰益发展壮大,人們每天可以获得的信息量呈指数级增長。怎样從這浩如瀚海的数据中找出我們需要的数据显得尤為重要。数据挖掘又為资料探勘、数据采矿。它是数据库知识发現中的一种环节。数据挖掘一般是指從大量的数据中通過算法搜索隐藏于其中信息的過程。数据挖掘一般与计算机科學有关,并通過记录、在线分析处理、情报检索、机器學习、专家系统(依托過去的經验法则)和模式识别等诸多措施来实現上述目的。

数据挖掘大体分為如下几类:分类(Classification)、估计(Estimation)、预测(Prediction)、有关性分组或关联规则(Affinitygroupingorassociationrules)、聚类(Clustering)、复杂数据类型挖掘(Text,Web,图形图像,视频,音频等)。

案例

?尿布与啤酒的故事。

在一家超市裏,有一种有趣的現象:尿布和啤酒赫然摆在一起发售。不過這個奇怪的举措却使尿布和啤酒的销量双双增長了。這不是一种笑话,而是发生在美国沃尔玛连锁店超市的真实案例,并一直為商家所津津乐道。沃尔玛拥有世界上最大的数据仓库系统,為了可以精确理解顾客在其门店的购置习惯,沃尔玛對其顾客的购物行為進行购物篮分析,想懂得顾客常常一起购置的商品有哪些。沃尔玛数据仓库裏集中了其各门店的详细原始交易数据。在這些原始交易数据的基础上,沃尔玛运用数据挖掘措施對這些数据進行分析和挖掘。一种意外的发現是:跟尿布一起购置最多的商品竟是啤酒!通過大量实际调查和分析,揭示了一种隐藏在尿布与啤酒背後的美国人的一种行為模式:在美国,某些年轻的父亲下班後常常要到超市去买婴儿尿布,而他們中有30%~40%的人同步也為自已买某些啤酒。产生這一現象的原因是:美国的太太們常叮嘱她們的丈夫下班後為小孩买尿布,而丈夫們在买尿布後又随手带回了他們喜欢的啤酒。

按常规思维,尿布与啤酒風馬牛不相及,若不是借助数据挖掘技术對大量交易数据進行挖掘分析,沃尔玛是不也許发現数据内在這一有价值的规律的。

在這個案例中使用了数据挖掘中的关联规则分析。关联分析是发現交易数据库中不一样项之间的联络。毫無疑問,关联分析中发現的规则為超市带来了更多的收益。假如我們能在生活中對关联分析進行应用,一定可以处理更多的問題。

数据关联是数据库中存在的一类重要的可被发現的知识。若两個或多种变量的取值之间存在某种规律性,就称為关联。关联可分為简朴关联、時序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有時并不懂得数据库中数据的关联函数,虽然懂得也是不确定的,因此关联分析生成的规则带有可信度。关联规则挖掘发現大量数据中项集之间有趣的关联或有关联络。Agrawal等于1993年首先提出了挖掘顾客交易数据库中项集间的关联规则問題,後来诸多的研究人员對关联规则的挖掘問題進行了大量的研究。他們的工作包括對原有的算法進行优化,如引入随机采样、并行的思想等,以提高算法挖掘规则的效率;對关联规则的应用進行推广。关联规则挖掘在数据挖掘中是一种重要的課題,近来几年已被业界所广泛研究。

关联规则

(一)关联规则定义

关联分析是一种简朴、实用的分析技术,就是发現存在于大量数据集中的关联性或有关性,從而描述了一种事物中某些属性同步出現的规律和模式。

关联分析是從大量数据中发現项集之间有趣的关联和有关联络。关联分析的一种經典例子是购物篮分析。该過程通過发現顾客放人其购物篮中的不一样商品之间的联络,分析顾客的购置习惯。通過理解哪些商品

文档评论(0)

159****9606 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档