第17章数据仓库与联.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第17章数据仓库与联

第17章数据仓库与联 机分析处理  数据仓库  联机分析处理技术  数据挖掘 实例 在实际应用中:  某个客户:某某酒吧销售某某啤酒的价 格是多少?操作型数据  某个投资商:每个酒吧在过去三个月里 销售所有啤酒的平均价格是多少?分析 型数据 操作型数据 OLTP 传统数据库:  细节的  在存取的时间时是正确的  可更新  性能要求高  事务驱动  面向应用  一次操作的数据量小  支持日常操作  。。。 分析型数据OLAP  综合的,提炼过的  代表过去数据  不经常更新  性能要求宽松  分析驱动  面向分析  一次操作数据量大  支持管理决策 OLTP 实例  简单的,经常被查询到的,涉及数量不多 的元组。  例如:某某酒吧销售某某啤酒的价格是多 少? OLAP 实例  复杂的查询,涉及大量的数据,可能需 要运行几个小时的查询。  实例:过去一年某条街上酒吧销售的总 量是多少?  查询不一定基于当前的数据库信息,可 以基于前一个月的数据库信息。 数据仓库 目的:构建新的分析处理环境而出现的一种数据 存贮和组织技术。 方法:  数据集成: 1. 拷贝很多数据源到一个数据仓库。 2. 不时更新数据仓库中的数据。 3. 主要用于数据的分析。 数据仓库的特点  数据是面向主题的  数据是集成的  数据是不可实时更新的  数据是随时间变化的 数据仓库的数据组织 数据仓库系统的体系结构  数据仓库的后台工 具  数据仓库服务器  OLAP服务器  前台工具 应用场景  分店进行OLTP.  分店的数据晚上拷贝到中央数据仓库  分析师对数据仓库进行OLAP. 数据仓库数据模型: Star Schemas 星型模式  星型模式是最常用的数据仓库模型: 1.事实表Fact table : 非常大的,带有各个维度的一 个表。Often “insert-only.” 2. 维表Dimension tables : 小的,关于各个实体详 细的,静态的信息表。 Example: Star Schema  假设我们要基于酒吧数据库管理系统,分析 每个酒吧,每一种啤酒,哪些客户每天的销 售情况:  我们要建立的事实表如下: Sales(bar, beer, drinker, day, time, price) Example -- Continued  维表如下: Bars(bar, addr, license) Beers(beer, manf) Drinkers(drinker, addr, phone) Time dimension is very special Days(day,week,month,year) 两种属性:维度属性和度量属 性 事实表中的属性分为: 1.维度属性 : 某一个维表中的码 2.度量属性:被分析衡量的属性,通常是数字 值,由各个维度共同来决定 维度属性可以有层次的  Hierarchy on dimension attributes: 可以在不同层次上查看维表的 数据。  E.g. the dimension DateTime can be used to aggregate by hour of day, date, day of week, month, quarter or year 度量属性  Price 是这个系统中需要衡量的指标。  它是基于不同维度的组合。  例如:价格可以从酒吧,啤酒,喝酒人 和时间共同来决定价格。 数据仓库数据模式: 星型模型和雪花模式 (维表可以有层次) 建立数据仓库的方法 1. ROLAP = “relational OLAP”: 应用关系数 据库来管理多维数据。 2. MOLAP = “multidimensional OLAP”: 用 一个特殊的DBMS (例如:数据立方体) 来实现。 ROLAP 实现技术 1. Bitmap indexes 位图

文档评论(0)

ldj215322 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档