第四章 数据库与数据挖掘的决策支持(下).ppt

第四章 数据库与数据挖掘的决策支持(下).ppt

  1. 1、本文档共85页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 数据库与数据挖掘的决策支持(下)

关联规则挖掘的基本概念 购物篮分析-引发关联规则挖掘的例子 问题:“什么商品组或集合顾客多半会在一次购物中同时购买?” 购物篮分析:设全域为商店出售的商品的集合(即项目全集),一次购物购买(即事务)的商品为项目全集的子集,若每种商品用一个布尔变量表示该商品的有无,则每个购物篮可用一个布尔向量表示。通过对布尔向量的分析,得到反映商品频繁关联或同时购买的购买模式。这些模式可用关联规则描述。 〖例〗购买计算机与购买财务管理软件的关联规则可表示为: computer financial_management_softwar [support=2%,confidence=60%] support为支持度,confidence为置信度。 该规则表示:在所分析的全部事务中,有2%的事务同时购买计算机和财务管理软件;在购买计算机的顾客中60%也购买财务管理软件。 关联规则 关联(Associations)分析的目的是为了挖掘隐藏在数据间的相互关系,即对于给定的一组项目和一个记录集,通过对记录集的分析,得出项目集中的项目之间的相关性。项目之间的相关性用关联规则来描述,关联规则反映了一组数据项之间的密切程度或关系。 置信度和支持度 关联规则 X?Y对事物集D的支持度(support,)定义为 D中包含有事务X和Y的百分比。关联规则X?Y对事务集合D的置信度(confidence)定义为D中包含有X的事务数与同时包含Y的百分比。即: support(X?Y)=(包含X和Y的事务数 / 事务总数)×100% confidence(X?Y)=包含X和Y的事务数 / 包含X的事务数)×100% 置信度和支持度均大于给定阈值(即最小置信度阈值和最小支持度阈值)。即: support(X?Y) = min_sup confidence(X?Y) = min_conf 的关联规则称为强规则;否则称为弱规则。 关联规则挖掘 数据挖掘主要就是对强规则的挖掘。通过设置最小支持度和最小置信度可以了解某些数据之间的关联程度。 关联规则挖掘:给定一组Item和记录集合,挖掘出Item间的相关性,使其置信度和支持度分别大于用户给定的最小置信度和最小支持度。 关联规则挖掘的过程 在关联规则挖掘算法中,把项目的集合称为项集(itemset),包含有k个项目的项集称为k-项集。包含项集的事务数称为项集的出现频率,简称为项集的频率或支持度计数。如果项集的出现频率大于或等于最小支持度s与D中事务总数的乘积,则称该项集满足最小支持度s。如果项集满足最小支持度,则称该项集为频繁项集(frequent itemset )。 关联规则的挖掘主要被分解为下面两步: 第1步:找出所有的频繁项集,即找出支持度大于或等于给定的最小支持度阈值的所有项集。可以从1到k递归查找k-频繁项集。 第2步:由频繁项集产生强关联规则,即找出满足最小支持度和最小置信度的关联规则。对给定的L,如果其非空子集A?L,sup(L)为L的支持度,sup(A)为A的支持度,则产生形式为A?L-A的规则。 The Apriori Algorithm—An Example * * * * * * * * * * * * * * * * * * * * * * * * CRM数据挖掘应用模板2-营销活动的响应分析 图例: 数据 数据流 RFM模型 交易数据 交易明细 客户消费卡 资料 数据合并 产品信息 产品明细 数据 产品数据 市场活动 数据 购买模式 数据 客户数据 RFM模型 结果数据 客户回应 分析 响应概率 发布 响应预测 对响应聚类 RFM响应 购买模式 数据 客户原始 数据 CRM 数据挖掘应用模板 - 模型2:结构 CRM数据挖掘应用模板3-细分迁移和客户流失分析 图例: 数据 数据流 客户价值 矩阵 客户金字塔 数据 客户购买 模式数据 客户数据 客户细分 迁移分析 客户细分 迁移数据 迁移模型 数据准备 细分迁移 模型发布 细分迁移 模型 客户流失 分析 迁移模型 结果数据 客户原始 数据 迁移模型 CRM 数据挖掘应用模板 - 模型3:结构 数据理解,数据探索性分析 CRM 数据挖掘应用模板初体验 计算客户价值 CRM 数据挖掘应用模板初体验(续) 描述客户价值分布及随时间变化情况 ? CRM 数据挖掘应用模板初体验(续) CRM 数据挖掘应用模板初体验(续) 全方位的服务 产品 培训 咨询 全球性的公司 与业界领袖的伙伴关系 Siebel Sybase NCR …… SPSS提供全方位的服务,帮助您获得成功 * 四 数据可视化 可视化是从多个与计算机相关的学科发展起来的,它涉及到计

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档