2025年数据仓库 学习资料.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

长风破浪会有时,直挂云帆济沧海。——李白

创新设计作业

张希远董新强崔庆俄

一、理解关系数据库与数据仓库的区别

1、发展背景:

在数据信息化和互联网技术高速发展的今天,数据已经处于爆炸状态,数据量一直

在急剧增大,因此如何应用这些数据成为人们面临的首要问题.从20实际60年代数据

库技术出现至今,经过几十年的发展,已日趋成熟完善.随着信息量的逐渐增加,人们

期望一种数据处理技术能够提供更高层次的数据分析功能,能访问并综合运用来自各种

数据源的数据,进行复杂的数据分析.在这种情形下,一种新型的数据库技术——数据

仓库技术应运而生。

2、关系数据库的概念

关系数据库,是创建在关系模型基础上的数据库,借助于集合代数等数学概念和方法来

处理数据库中的数据。现实世界中的各种实体以及实体之间的各种联系均用关系模型来

表示。

3、数据仓库的概念

数据仓库领域的权威W.H.Inmon给出了数据仓库的一个简短而全面的定义:数据仓

库是一个面向主题、集成、时变、非易失的数据集合,是支持管理部门的决策过程。根

据该定义,数据仓库具备以下四个关键特征:

3.1面向主题(SubjectOriented)的数据集合

数据仓库通常围绕一些主题,如“产品”、“销售商”、“消费者”等来进行组织。数据仓库

关注的是决策者的数据建模与分析,而不针对日常操作和事务的处理。因此,数据仓库

提供了特定主题的简明视图,排除了对于决策无用的数据。

3.2集成(Integrated)的数据集合

数据仓库通常是结合多个异种数据源构成的,异种数据源可能包括关系数据库、面向对

象数据库、文本数据库、Web数据库、一般文件等。

3.3时变(TimeVariant)的数据集合

先天下之忧而忧,后天下之乐而乐。——范仲淹

数据存储从历史的角度提供信息,数据仓库中包含时间元素,它所提供的信息总是与时

间相关联的。数掘仓库中存储的是一个时间段的数据,而不仅仅是某一个时刻的数据。

3.4非易失(Nonvolatile)的数据集合

数据仓库总是与操作环境下的实时应用数据物理地分离存放,因此不需要事务处理、恢

复和并发控制机制。数据仓库里的数据通常只需要两种操作:初始化载入和数据访问,

因此其数据相对稳定,极少或根本不更新。

综上所述,数据仓库是一种语义上一致的数据存储,它充当决策支持数据模型的物理实

现,并存放企业战略决策所需信息。数据仓库也常常被视为一种体系结构,通过将异种

数据源中的数据集成在一起而构成,支持结构化和专门的查询、分析报告和决策制定。

4、关系数据库和数据仓库的区别

传统的关系型数据库RDB遵循一致的关系型模型,其中的数据(记录)以表格的方

式存储,并且能用统一的结构化查询语言(StructualQueryLanguage,SQL)进行数据查询,

因此它的应用常被称为联机交易处理(OLTP),其重点在于完成业务处理,及时给予客户

响应。关系型数据库能够处理大型数据库,但不能将其简单地堆砌就直接作为数据仓库

来使用。数据仓库主要工作的对象为多维数据,因此又称为多维数据库。多维数据库的

数据以数组方式存储,既没有统一的规律可循,也没有统一的多维模型可循,它只能按

其所属类别进行归类。以应用而言,多维数据库应该具备极强的查询能力,多维数据库

中存储的信息既多又广,但由于其完成的是一种联机事物分析(OLAP),因此并不追求瞬

时的响应时间,在有限的时间中给予响应即被认可。实际上,OLAP包含交互式的数据

您可能关注的文档

文档评论(0)

155****8565 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档