网站大量收购闲置独家精品文档,联系QQ:2885784924

数据仓库与决策支持系统2.pptVIP

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库与决策支持系统2

四、Apriori算法 Apriori算法首先计算所有1-项集C1,找出所有频繁1-项集L1,然后根据频繁1-项集确定候选2-项集C2,从C2中找出所有频繁2-项集L2,在L2中选出C3,以此类推,直到不再有候选项集为止。 其过程如下: Lk:所有频繁k项集的集合;Ck:所有候选k项集的集合 通过单趟遍历数据库D,计算出各个1-项集的支持度,构成L1 在Lk中,用联合(join)运算生成候选项集Ck+1 联合运算:若p,q包含于Lk,p={p1,p2,...,pk-1},q={q1,q2,…,qk-1},且当1ik-1时有pi=qi,当i=k-1时有pk-1qk-1,则p与q的并集是候选项集Ck+1中的一个项集。 计算Ck中的支持度,将小于最小支持度的候选集删除,满足的构成频繁项集Lk+1,继续迭代循环,直到不再有新的频繁项集为止。 五、参考文献 数据仓库应用技术的研究与实现_方红萍 数据仓库和数据挖掘在决策支持系统中的应用研究_卢硕 基于数据仓库的决策支持系统的研究与开发_杨士哲 基于数据仓库技术的决策支持系统的研究与应用_李敏强 基于数据仓库和数据挖掘技术的温室决策支持系统_王成 * * * * * * * * * * * * * * * * * * - * - - * - - * - - * - - * - http://RecS - * - http://RecS - * - http://RecS - * - http://RecS - * - http://RecS - * - http://RecS - * - http://RecS - * - http://RecS - * - http://RecS - * - http://RecS - * - 数据仓库与决策支持系统 2015.10.12 一、数据仓库 数据仓库:面向主题的、集成的、稳定的、随时间变化的数据集合 面向主题指数据仓库的建立有一个主体的对象,而非单一的事务 集成表示数据仓库是将围绕该主题的各类数据集成在一起而形成 稳定意味着不可更新 随时间变化指对应不同时间点,有不同批次的数据 一、数据仓库 数据仓库VS数据库 比较内容 数据仓库 数据库 目标 Online Analytical Processing Online Transaction Processing 作用 面向主题 面向过程 活动 分析 事务处理 构成 集成 分散 内容 不可更改 可更改 系统需求 事先可以不知道 事先已知 数据量 一次操作数据量大 一次操作数据量小 时间性 时序性 当前 基础结构 多维型 关系型 关系结构 星型、雪花 3NF 终端用户 管理者、决策者 事务操作人员 一、数据仓库 分析型处理VS事务型处理 比较内容 分析型处理 事务型处理 性能特性 运行时间较长、消耗大量系统资源 数据存取频率高、处理时间短 数据集成问题 需要大量的、集成的数据作为分析基础 大多数应用数据是分散的、不一致的 动态集成 需要集成数据的周期性更新 仅在开始阶段对数据进行静态集成 历史数据问题 许多分析方法要以大量的历史数据为依据 一般只需要当前或短期数据 数据综合问题 主要关注综合性数据 积累了大量的细节数据 一、数据仓库 数据仓库体系结构 一、数据仓库 元数据(Metadata):关于数据的数据。在数据仓库系统中,元数据可以帮助数据仓库管理员和数据仓库的开发人员非常方便地找到他们 所关心的数据;元数据是描述数据仓库内数据的结构和建立方法的数据,可将其按用途的不同分为两类:技术元数据(Technical Metadata)和业务元数据(Business Metadata)。   技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据,它主要包括以下信息:   数据仓库结构的描述,包括仓库模式、视图、维、层次结构和导出数据的定义,以及数据集市的位置和内容;   业务系统、数据仓库和数据集市的体系结构和模式;   汇总用的算法,包括度量和维定义算法,数据粒度、主题领域、聚集、汇总、预定义的查询与报告;   由操作环境到数据仓库环境的映射,包括源数据和它们的内容、数据分割、数据提取、清理、转换规则和数据刷新规则、安全(用户授权和存取控制)。    一、数据仓库 业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的 数据。业务元数据主要包括以下信息:使用者的业务术语所表达的数据模型、对象名和属性名;访问数据的原则和数据的来源;系统所提供的分析方法以及公式和报 表的信息;具体包括以下信息:   企业概念模型:这是业务元数据所应提供的重要的信息,它表示企业数据模型

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档