- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1.4.2 数据仓库为什么是分离的? 数据仓库的查询通常是复杂的,涉及大量数据在汇总级的计算,可能需要特殊的数据组织、存取方法和基于多维视图的实现方法。对数据记录进行只读访问,以进行汇总和聚集。 如果OLTP和OLAP都在操作型数据库上运行,会大大降低数据库系统的吞吐量。 数据仓库与操作型数据库分离是由于这两种系统中数据的结构、内容和用法都不相同。 1.4.3 数据仓库与操作型数据库的对比 数据仓库 操作型数据库 面向主题 面向应用 容量巨大 容量相对较小 数据是综合的或提炼的 数据是详细的 保存历史的数据 保存当前的数据 通常数据是不可更新的 数据是可更新的 操作需求是临时决定的 操作需求是事先可知的 一个操作存取一个数据集合 一个操作存取一个记录 数据常冗余 数据非冗余 操作相对不频繁 操作较频繁 所查询的是经过加工的数据 所查询的是原始数据 支持决策分析 支持事务处理 决策分析需要历史数据 事务处理需要当前数据 需做复杂的计算 鲜有复杂的计算 服务对象为企业高层决策人员 服务对象为企业业务处理方面的工作人员 1.4.4 ODS 操作型数据库系统出现了ODS(Operational Data Store,操作数据存储)的概念,它是企业级的全局数据库,用于提供集成的、企业级一致的数据,包含如何从各子系统数据库中向ODS抽取数据以及从面向主题的角度从各子系统数据库中抽取的数据。 ODS具有面向主题的、集成化的、可变的、数据是当前的或接近当前的特点。ODS不具有数据仓库的稳定性和时变性的特点,它主要用于支持企业级的OLTP,但由于ODS具有数据仓库面向主题和集成的特点。 1.5 商务智能与数据仓库的关系 商务智能简称为BI(Business Intelligence),也称为商业智能。 商务智能是融合了先进信息技术与创新管理理念的结合体,对与企业有关的所有内部和外部的数据进行收集、汇总、过滤、分析、传递、综合利用,使得数据转换成为信息和知识的过程。商务智能可以整合历史数据,从多个角度和层面地数据展开深层次的分析、处理,为决策者提供相应的决策依据,提高决策效率和水平。 一般来说,上面所描述的是一个广义上的商务智能概念,在这个概念层面上,数据仓库是其中非常重要的组成部分,数据仓库从概念上更多地侧重在对企业各类信息的整合和存储工作,包括了数据的迁移,数据的组织和存储,数据的管理与维护,这些称之为后台基础性的数据准备工作。 与之对应,侠义的商务智能概念则侧重在数据查询和报告、多维/联机数据分析、数据挖掘和数据可视化工具这些平常称之为前台的数据分析应用方面,其中数据挖掘是商务智能中比较高层次的一种应用。 ━━本章完━━ 数据仓库与数据挖掘 李春葆,李石君,李筱驰 电子工业出版社 2014 原理及实践 第1章 数据仓库概述 1.1 数据仓库及其历史 20世纪60年代出现了数据库的概念,确立了数据库系统的许多概念、方法和技术。 70年代由E.F.Codd提出了数据库的关系理模型,开创了数据库关系方法和关系数据理论的研究,为关系数据库技术奠定了理论基础。 80年代出现成熟的关系数据库管理系统(DBMS)。 90年代以后进入数据处理大发展时期,各种数据模型、数据库新技术层出不穷地涌现,如数据仓库和数据挖掘、商务智能、多媒体数据库和Web数据库等。 1.1.1 数据库技术的发展 1.1.2 什么是数据仓库 1. 数据仓库的定义 W.H.Inmon:数据仓库是: 一个面向主题的、集成的、稳定的、随时间变化的数据的集合,以用于支持管理决策过程。 2. 数据仓库的特征 ◎ 面向主题 主题是指用户使用数据仓库进行决策时所关心的重点领域,也就是在一个较高的管理层次上对信息系统的数据按照某一具体的管理对象进行综合、归类所形成的分析对象。 面向主题组织的数据具有以下特点: 各个主题有完整、一致的内容以便在此基础上作分析处理。 主题之间有重迭的内容,反映主题间的联系。重迭是逻辑上的,不是物理上的。 各主题的综合方式存在不同。 主题域应该具有独立性(数据是否属于该主题有明确的界限)和完备性(对该主题进行分析所涉及的内容均要在主题域内)。 ◎ 集成 数据仓库中存储的数据一般从企业原来已建立的数据库系统中提取出来,但并不是原有数据的简单拷贝,而是经过了抽取、筛选、清理、转换、综合等工作。 ◎ 稳定性即非易失的 操作型数据库系统中一般只存储短期数据,因此其数据是不稳定的,它记录的是系统中数据变化的瞬态。 数据仓库中的数据大多表示过去某一时刻的数据,主要用于查询、分析,不像业务系统中的数据库那样,要经常进行修改、添加,除非数据仓库中的数据是错误的。 ◎ 随时间而变化即时变的
文档评论(0)