01 数据仓库概述.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
01 数据仓库概述

数据的“时间特性” 数据仓库中的每一个数据结构都包含了时间要素。 数据仓库中的数据是和时间变化相关的数据 可以对过去进行分析 与当前的信息相关 可以对未来进行预测 * 数据的非易变性(相对稳定) 操作型系统的数据实时地进行更新,每次交易发生都要更新;数据仓库中的数据非实时性更新 数据仓库中的数据是用来进行查询和分析的 不能在数据仓库中实时地删除数据 不能在数据仓库中修改数据 * 决策支持系统 操作型系统 OLTP数据库 数据仓库 读取 增加 修改 删除 读取 2 数据仓库和数据集市 数据仓库和数据集市(Data Mart)是一个混淆不清的概念。是学术界争论的话题 Bill Inmon(1998):“今年IT经理面对的最重要的问题就是到底先建数据仓库还是先建立数据集市”,今天依然如此。 在建立数据仓库前,我们需要考虑下列这些问题: 采取自上而下还是自下而上的方法 企业范围还是部门范围 先建立数据仓库还是数据集市 数据集市是否相互独立 * 数据仓库 vs. 数据集市 数据仓库 数据集市 完整的,从企业整体考虑的 部门的 所有数据集市的集合 一个单独的商业处理过程 从阶段区域得到的数据 星型结构 通过展示的方式进行查询 适合数据连接和分析技术 基于公司数据视角的结构 基于适合部门数据视角的结构 通过实体-关系模式进行组织 * 纲要 数据仓库技术产生的背景 数据仓库定义 数据仓库的组成部件 商务智能 * 数据仓库的组成部分(Component) * 源数据部分 主要类别 生产数据:多个系统多种数据的标准化、转换、整合 内部数据:表格、文档 存档数据:旧的历史的数据 外部数据:社会的企业,社会的人 * 数据准备部分 ETL ( ETCL ) 数据抽取(Extract):多源、异构数据的抽取 数据转换(Transform): 清洗( Clean)、标准化等过程 数据装载(Load) * 数据存储部分 数据仓库的数据存储器是一个独立的部分 与操作型的数据库分开存储 大多数数据仓库都采用关系数据库管理系统 * 信息传递部分 多种信息传递方式 特别的报表 复杂的查询 多维分析 统计分析 主管信息系统的需求 数据挖掘 * 元数据 MetaData 描述数据的数据 数据仓库内容的一本字典 元数据是数据仓库数据本身信息的数据 元数据对于数据仓库极其重要 * 纲要 数据仓库技术产生的背景 数据仓库定义 数据仓库的组成部件 商务智能 * 2007年三大并购案 商务智能开始发力,渐入佳景 Oracle 33亿美金 收购 Hyperion SAP 48亿欧元 收购 Business Object IBM 50亿美金 收购 Cognos 2006年IDC 商务智能领域 10强 BO 8.94亿美元 SAS 6.79亿美元 微软 、Hyperion、 Oracle 、SAP * 厦门大学软件学院 * 国内BI状况 厦门大学软件学院 * Gartner 2013年:中国BI市场份额 11.75亿美元 商务智能 Business Intelligence BI概念提出:Gartner Group( 1996年) BI通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。 数据包括来自企业业务系统的订单、库存、交易账目、客户和供应商等来自企业所处行业和竞争对手的数据以及来自企业所处的其他外部环境中的各种数据。 商业智能能够辅助的业务经营决策,既可以是操作层的,也可以是战术层和战略层的决策。 * 为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。 BI的实现涉及到软件、硬件、咨询服务及应用,其基本体系结构包括数据仓库、联机分析处理和数据挖掘三个部分。???? BI是一种解决方案。 * BI的关键 从许多来自不同的企业运作系统的数据中提取出有用的数据并进行清理,以保证数据的正确性, 然后经过抽取、转换和装载,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图, 在此基础上利用合适的查询和分析工具、数据挖掘工具、OLAP工具等对其进行分析和处理(这时信息变为辅助决策的知识), 最后将知识呈现给管理者,为管理者的决策过程提供支持。 * 数据仓库 Data Warehousing: DW 联机分析处理 Online-Analyst Processing: OLAP 数据挖掘 Data Mining:DM * 课后作业 自行安装SQLServer 查以下资料 淘宝招聘的数据库、数据分析、数据仓库、数据挖掘等职务的条件 到招聘网

文档评论(0)

jiupshaieuk12 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6212135231000003

1亿VIP精品文档

相关文档