- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 1.8 多维数据的存储方式 ROLAP ROLAP的数据与计算结果直接由原来的关系数据库取得。 ROLAP将支撑多维数据的原始数据、多维数据集数据、汇总数据和维度数据都存储在现有的关系数据库中,并用独立的关系表来存放聚集数据。 不存储源数据副本,占用的磁盘空间最少,但存取速度也比较低。 * 1.8 多维数据的存储方式 MOLAP MOLAP使用多维数组存储数据,它是一种高性能的多维数据存储格式。 多维数据在存储中将形成“立方体”的结构。MOLAP存储模式将数据与计算结果都存储在立方体结构中,并存储在分析服务器上。 该结构在处理维度时创建。 存取速度最快,查询性能最好,但占用磁盘空间较多。 * 1.8 多维数据的存储方式 HOLAP ROLAP与MOLAP存储方式的结合。 原始数据和ROLAP一样存储在原来的关系数据库中,而聚合数据则以多维的形式存储分析服务器。 优点: 既能与关系数据库建立连接,同时又利用了多维数据库的性能优势。 缺点 是在ROLAP和MOLAP系统之间的切换会影响它的效率。 * 1.8 多维数据的存储方式 内容 MOLAP ROLAP HOLAP 源数据的副本 有 无 无 占用分析服务器存 储空间 大 小 小 使用多维数据集 小 较大 大 数据查询 快 慢 慢 聚合数据的查询 快 慢 快 使用查询频度 经常 不经常 经常 三种存储方式的比较 作业 从Internet网搜索至少5个数据仓库系统,并简单介绍其中一个系统的作用和功能。(要求写出系统名称和网页地址) * * 小结 数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合,这些也正是其区别于传统操作型数据库的特性所在。 OLAP又称为多维数据分析,它的多维性、分析性、快速性和信息性成为分析海量历史数据的有力工具。 数据仓库的体系结构:数据库、数据抽取、转换、加载、元数据、访问工具、数据集市、管理平台、信息发布系统。 * 1.3数据仓库体系结构 层次数据(企业信息源) * 1.3数据仓库体系结构 数据集市(Data Marts) 定义 为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也称部门数据或主题数据。 如:财务部门的数据集市 与数据仓库的关系 数据仓库是基于整个企业的数据模型建立的,它面向企业范围内的主题。而数据集市是按照某一特定部门的数据模型建立的。 * 1.3数据仓库体系结构 数据集市(Data Marts)(续) 特性 规模小 特定的应用 面向部门 由业务部门定义,设计和开发 由业务部门管理和维护 快速实现 购买较便宜 投资快速回收 更详细的、预先存在的数据仓库的摘要子集 可升级到完整的数据仓库 * 1.3数据仓库体系结构 数据集市(Data Marts)(续) * 1.4 数据准备和ETL 数据集成(抽取、转换、装载--ETL) * 1.4数据准备和ETL 数据集成(抽取、转换、装载--ETL) * 1.5 多维模型 多维模型 概念 是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。 特性 多维,也称作立方体(或超立方体) 提供一种便于使用的查询数据的机制。 * 1.5 多维模型 * 1.5 多维模型 度量值(Measure) 度量值是一组值,是客户发生事件或动作的事实记录。 如: 客户打电话,记录次数和费用等; 超市客户销售,记录销售数量、金额等等。 度量值所在的表称为事实数据表,常规多维数据集的结构中只能有一个事实数据表。 * 1.5 多维模型 维度(Dimension) 维度(也简称为维)是人们观察数据的角度。 例如,时间维,地区维等。 包含维度信息的表是维度表,维度表包含描述事实数据表中的事实记录的特性。 描述维度的字段称为维度属性 * 1.5 多维模型 维度成员(Dimension Member) 维的一个取值称为该维的一个维度成员(简称维成员)。 例如,考虑时间维具有日、月、年这3个级别,分别在日、月、年上各取一个值组合起来,就得到了时间维的一个维成员,即“某年某月某日”。 * 1.5 多维模型 维度的层次结构 定义 层次结构是维度中成员的集合以及这些成员之间的相对位置。 如,地址维:洲、国家、城市、区、街道、门牌号 类型 均衡层次结构 层次结构的所有分支都降至同一级别,每个成员的逻辑父代就是其上级成员。 不均衡层次结构 层次结构的所有分支都降至不同级别,每个成员的逻辑父代就是其上级成员。如CEO/部门经理(/员工)、执行秘书 不规则层次结构 * 1.5 多维模型 维的级别(Dimension Level) 人们观察数据的某个特定角度(即某个维)还可以存在不同的细节程度,我们称这些维度的不同的细节程度为维的级
文档评论(0)