- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一讲数据仓库基础 内容 问题 什么是数据仓库? 为什么要建数据仓库? 建数据仓库能带来哪些好处? 1.1 什么是数据仓库 数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented )、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策和信息的全局共享。 ——数据仓库之父[William H.Inmon] 1.1.1 数据仓库特点(面向主题的) 1.1.2 数据仓库特点(集成的) 1.1.3 数据仓库特点(相对稳定的) 1.1.4 数据仓库特点(反应历史变化的) 1.2 对数据仓库系统的理解 数据仓库系统用于支持管理和决策,面向分析型数据处理,它不同于企业现有的面向交易的操作型数据库; 数据仓库系统是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据。 与其他数据库应用不同的是,数据仓库更像一种过程,对分布在企业内部各处的业务数据的整合、加工和分析的过程。 1.3 数据仓库的组成 1.3.1 数据仓库数据库 数据仓库数据库是整个数据仓库的核心,是数据信息存放的地方,对数据提供存取和检索支持。相对于传统数据库来说,其突出的特点是对海量数据的支持和快速的检索技术。 1.3.2 数据抽取工具 数据抽取工具是把数据从各种各样的存储环境中提取出来,进行必要的转化、整理,再存放到数据仓库内。对各种不同数据的存储方式的访问能力是数据抽取工具的关键,可以运用高级语言编写的程序、操作系统脚本、批命令脚本或SQL脚本等方式,访问不同的数据环境。 数据转换通常包括如下内容: 删除对决策分析没有意义的数据。 转换到统一的数据名称和定义。 计算统计和衍生数据。 填补缺失数据。 统一不同的数据定义方式。 1.3.3 OLAP服务器 OLAP服务器是用于存储多“维”数据的,存储结构类似与立方体的结构,提供给用户快速的数据分析支持。 1.3.4 元数据 元数据是描述数据仓库数据的结构和建立方法的数据,全面描述了数据仓库中有什么数据,这些数据是怎么得到,数据的来源是哪里等。简言之:元数据就是数据的数据。 元数据分为技术元数据和业务元数据。技术元数据是面向设计和管理人员的,包括数据源信息、数据结构定义、数据转换规则等。业务元数据是面向业务使用人员的,主要是从业务的视角来描述业务主题。 1.3.5 数据展现工具 数据展现工具为用户访问数据仓库提供的手段,如:数据查询和报表工具、应用开发工具、数据分析工具、数据挖掘工具等。 1.3.6 数据集市 数据展现工具为用户访问数据仓库提供的手段,如:数据查询和报表工具、应用开发工具、数据分析工具、数据挖掘工具等。 数据集市的划分有很多中,如 按照时间划分(07年、08年、09年等) 按照地域划分(广州、深圳、珠海等) 按照业务划分(生产、销售、财务等) …… 1.3.7 数据仓库管理 数据仓库管理包括安全与权限的管理、数据更新的跟踪、数据质量的检查、元数据的管理和更新、数据仓库使用状态的监测与审计、数据复制与删除、数据分割与分发、数据备份与恢复、数据存储管理等。 1.3.8 信息发布系统 信息发布系统是把数据仓库中的数据,或其他相关的数据发送给不同的地点或用户。 基于Web的信息发布系统是当前比较流行的多用户访问的最有效方法。 问题 什么是数据仓库? 为什么要建数据仓库? 数据集成问题 数据动态集成问题 历史数据问题 数据的综合问题 建数据仓库能带来哪些好处? 公司领导层:了解公司全貌,辅助进行战略决策 中间管理层:掌控部门业务情况,协助制定管理策略 基层管理人员:掌握基层单位或个人绩效,实施有效管理 内容 2.1 什么是OLAP OLAP(Online Analysis Process)是针对特定问题的联机数据访问和分析。通过对信息(维数据)的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。 对OLAP的理解 OLAP的目标是满足决策支持或多维环境特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也可以说是多维数据分析工具的集合。 2.2 OLAP基础概念(一) 维度(Dimension) 人们观察数据的特定角度,是考虑问题时的一类属性,属性集合构成一个维(时间维、地理维等)。 量度(Measure) 具体的指标值,如客户数、收入等 层次(Hierarchy) 人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的各个描述方面(时间维:年-季度-月份-日期)。 成员(Member) 维的一个取值。是数据项在某维中位置的描述。 2.2 OLAP基础概念(二)
文档评论(0)