- 1、本文档共88页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
6.1 数据仓库的基本原理
6.2 数据仓库系统
6.3 联机分析处理
6.4 数据仓库的决策支持;6.1 数据仓库的基本原理;6.1.1 数据仓库的概念;1、数据仓库的概念;1、数据仓库的概念;操作型数据(DB数据)与
分析型数据(DW数据)之间的差别为:;2、数据仓库特点;2、数据仓库特点;2、数据仓库特点;2、数据仓库特点; 近期基本数据:是最近时期的业务数据,是数据仓库用户最感兴趣的部分,数据量大。
历史基本数据:近期基本数据随时间的推移,由数据仓库的时间控制机制转为历史基本数据。
轻度???合数据:是从近期基本数据中提取出的,这层数据是按时间段选取,或者按数据属性(attributes)和内容(contents)进行综合。
高度综合数据层:这一层的数据是在轻度综合数据基础上的再一次综合,是一种准决策数据。;;
数据仓库工作范围和成本常常是巨大的。开发数据仓库是代价很高、时间较长的大项目。
提供更紧密集成的数据集市就应运产生。
目前,全世界对数据仓库总投资的一半以上均集中在数据集市上。;
数据集市(Data Marts)是一种更小、更集中的数据仓库,为公司提供分析商业数据的一条廉价途径。
数据集市是指具有特定应用的数据仓库,主要针对某个应用或者具体部门级的应用,支持用户获得竞争优势或者找到进入新市场的具体解决方案。;独立数据集市(Independent Data Mart)
从属数据集市(Dependent Data Mart); 1、规模是小的
2、特定的应用
3、面向部门
4、由业务部门定义,设计和开发
5、由业务部门管理和维护
6、快速实现
7、购买较便宜
8、投资快速回收
9、工具集的紧密集成
10、更详细的、预先存在的数据仓库的摘要子集
11、可升级到完整的数据仓库; 元数据是数据仓库的重要组成部分。
元数据描述了数据仓库的数据和环境,即关于数据的数据(meta data)
元数据包括四种元数据。;元数据是现有的业务系统的数据源的描述信息。元数据是对不同平台上的数据源的物理结构和含义的描述。具体为:
(1)数据源中所有物理数据结构,包括所有的数据项及数据类型。
(2)所有数据项的业务定义。
(3)每个数据项更新的频率,以及由谁或那个过程更新的说明。
(4)每个数据项的有效值。;
数据仓库的数据模型是星型模型。
通常企业数据模型被用作建立仓库数据模型的起始点,再对模型加以修改和变换。
;元数据是数据源与数据仓库数据间的映射。
当数据源中的一个数据项与数据仓库建立了映射关系,就应该记下这些数据项发生的任何变换或变动。即用元数据反映数据仓库中的数据项是从哪个特定的数据源填充的,经过那些转换,变换和加载过程。; 这类元数据是数据仓库中信息的使用情况描述。
数据仓库的用户最关心的是两类元数据:
(1)元数据告诉数据仓库中有什么数据,它们从哪里来。即如何按主题查看数据仓库的内容。
(2)元数据提供已有的可重复利用的查询语言信息。如果某个查询能够满足他们的需求,或者与他们的愿望相似,他们就可以再次使用那些查询而不必从头开始编程。
关于数据仓库使用的元数据能帮助用户到数据仓库查询所需要的信息,用于解决企业问题。;6.2 数据仓库系统;1、数据仓库管理系统;(3)管理部分
它用于管理数据仓库的工作,包括:
(1)对数据仓库中数据的维护
(2)把仓库数据送出给分散的仓库服务器或DSS用户
(3)对仓库数据的安全、归档、备份、恢复等处理工作
;(4)信息目录部件(元数据)
数据仓库的目录数据是元数据,由三部分组成:
技术目录:由定义部件生成,关于数据源、目标、清理规则、变换规则以及数据源和仓库之间的映象信息。
业务目录:由仓库管理员生成,关于仓库数据的来源及当前值;预定义的查询和报表细节;合法性要求等。
信息引导器:使用户容易访问仓库数据。利用固定查询或建立新的查询,生成暂时的或永久的仓库数据集合的能力等。; 分析工具集分两类工具:
(1)查询工具
数据仓库的查询不是指对记录级数据的查询,而是指对分析要求的查询。
一般包含:
可视化工具:以图形化方式展示数据,可以帮助了解数据的结构,关系以及动态性。;
多维分析工具(OLAP工具):
通过对信息的多种可能的观察形式进行快速、一致和交互性的存取,这样便利用户对数据进行深入的分析和观察。
多维数据的每一维代表对数据的一个特定的观察视角,如时间、地域、业务等。;(2)数据挖掘工具
从大量数据中挖掘具有规律性知识,需要利用
您可能关注的文档
- 东北财经大学中级财务会计第5章长期股权投资.pptx
- 东南亚国家旅游概况老挝.pptx
- 东北印象培训管理学院.pptx
- 东亚石化集团财务公司内部结算中心.pptx
- 业绩评价的理论与方法.pptx
- 业绩评价企业的目标和政策.pptx
- 业绩考核体系与激励机制.pptx
- 业务部门业务与规划能力的提昇(PPT).pptx
- 业务部门交流培训课件.pptx
- 业务部交流学习之家具图纸篇.pptx
- 2024年江西省寻乌县九上数学开学复习检测模拟试题【含答案】.doc
- 2024年江西省省宜春市袁州区数学九上开学学业水平测试模拟试题【含答案】.doc
- 《GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语》.pdf
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
文档评论(0)