第十七课--数据仓库和数据集市.pptx

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库和数据集市Copyright?2007-2009 创智新程Copyright? 2007 创智新程数据仓库和数据集市目标什么是数据仓库数据仓库系统体系结构操作数据库与数据仓库的区别维度建模的相关概念维度建模的基本步骤数据集市Copyright? 2007 创智新程数据仓库的定义数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volation)、反映历史变化(Time Variant)的集合数据,用于支持管理决策和信息的全局共享。--W.H.InmonCopyright? 2007 创智新程面向主题的数据仓库是面向不同的主题域进行组织。一个主题通常与多个操作型信息系统相关。Copyright? 2007 创智新程集成的数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。Copyright? 2007 创智新程相对稳定的数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。Copyright? 2007 创智新程反映历史变化的数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。Copyright? 2007 创智新程数据仓库系统体系结构Copyright? 2007 创智新程数据仓库系统体系结构数据源数据存储及管理OLAP引擎前端工具Copyright? 2007 创智新程操作数据库与数据仓库的区别操作数据库系统的主要任务是联机事务处理OLTP。数据仓库在数据分析和决策方面为用户提供服务,这种系统称为联机分析处理OLAP。Copyright? 2007 创智新程维度建模的相关概念数据仓库数据集市事实维度数据挖掘Copyright? 2007 创智新程维度建模的相关概念分析空间数据仓库中一定量的数据,用于进行数据挖掘以发现新信息同时支持管理决策。切片一种用来在数据仓库中将多个维度中的分析空间限制为数据子集的技术。星型模型一种使用关系数据库实现多维分析空间的模型。雪花模型不管什么原因,当星型模型的维度需要进行规范化时,星型模型就演化为雪花模型。Copyright? 2007 创智新程多维数据模型一种非规范化的关系模型。由一组属性构成的表所组成。表跟表之间的关系通过关键字和外键来定义。以良好的可理解性和方便的产生报表来进行数据组织,很少考虑修改的性能。通过SQL或者相关的工具实现数据的查询和维护。Copyright? 2007 创智新程多维数据模型数据仓库和OLAP工具基于多维数据模型,该模型将数据看作数据立方体形式。数据立方体允许以多维对数据建模和观察。一个具有 x、y、z 维度的方块Copyright? 2007 创智新程多维数据模型的组成维事实数据立方体Copyright? 2007 创智新程多维数据模型举例关系表与多维CubeCopyright? 2007 创智新程多维建模技术星型和雪花模式是主要的存在形式。星型模式包含一个大的包含大批数据的事实表和一系列维表。雪花模式是星型模式的变种,不同的是将某些维表规范化。Copyright? 2007 创智新程定货表定单号定货日期事实表定单号...日期标识..日期表日期标识日月星型模式Copyright? 2007 创智新程事实表定货表定单号...日期标识..定单号定货日期日期表年月年日期标识日月雪花模式维表进一步层次化,改善查询性能,增加表数量,增加查询复杂性。Copyright? 2007 创智新程事实表每一个事实表通常包含了处理所关心的一系列的度量值。每一个事实表的行包括:具有可加性的数值型的度量值。文本事实通常具有不可预见的内容,很难进行分析。与维表相连接的外键。通常具有两个和两个以外的外键。外键之间表示维表之间多对多的关系。Copyright? 2007 创智新程事实表事实表的特征非常大包含几百几千条甚至几万、几十万的记录。内容相对的窄列数较少经常发生变化现实世界中新事件的发生-〉事实表中增加一条记录。典型情况下,仅仅是数据的追加。事实表的使用各类度量值的聚类计算Copyright? 2007 创智新程维表每一张维表对应现实世界中的一个对象或者概念。例如:客户、产品、日期、地区、商场维表的特征包含了众多描述性的列维表的范围很宽(具有多个属性)通常情况下,跟事实表相比,行数相对较少通常<10万条内容相对固定几乎就是一类查找表Copyright? 2007 创智新

您可能关注的文档

文档评论(0)

ayangjiayu1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档