清华大学数据库access课件第13章:数据仓库.pptVIP

清华大学数据库access课件第13章:数据仓库.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
清华大学数据库access课件第13章:数据仓库

数据仓库 数据库技术的发展 数据仓库的概念 数据仓库的结构 数据仓库的特点 数据集市 数据仓库的开发过程 基于数据仓库的联机分析挖掘 供应商分析 案例介绍 §13.7 基于数据仓库的OLAM 基于数据库技术的决策支持系统DSS的解决方案:DW+OLAP+DM→DSS §13.7 基于数据仓库的OLAM 相关项目 国家八六三项目: 面向市场分析与预测的数据仓库平台 国家八六三项目: 并行数据仓库研究 国家973项目: 万维网上的数据集成、数据仓储及知识发现的有效算法和软件系统 基金项目 Native XML DBMS研究与开发 其他…… §13.7 基于数据仓库的OLAM 关键问题 目标问题: 建设数据仓库是手段不是目的,目的是为了: OLAP DM DSS 数据质量问题: 大多数数据仓库项目失败的原因; 上海宝钢数据仓库建设成功的经验: 注重原始数据,DB建设和DW建设一起抓; 记录尽可能多的原始数据:DB?ODS?DW; 前后经历了十几年的时间,投资巨大。 数据仓库的未来? * 第13章 数据仓库 讲课内容: 经过近40年的发展,数据库系统的核心技术已经相当成熟,主要表现在商业数据库系统的日益完善及其强大功能。随着信息技术的快速发展,在数据库应用方面不断地出现新面孔,而数据库系统本身的研究也在不断地在扩展。 数据仓库 Web数据集成与管理 数据挖掘 流数据处理 Native XML DBMS 传感器数据管理 数字图书馆管理系统 …… §13.1 数据库技术的发展 数据库技术发展的里程碑 60年代早期: 利用文件系统生成各种报告。 60年代中期: 大量的文件使得维护和开发的复杂性提高,数据的同步亦成问题。 70年代早期: E.F.Codd提出关系数据模型、关系代数和E-R数据建模方法,数据库技术日趋成熟。 70年代中期: 高性能的联机事务处理(Online Transaction Processing,简称OLTP)应用越来越广泛。 §13.1 数据库技术的发展 数据库技术发展的里程碑 80年代早期: OLTP、MIS-Management Information System和DSS-Decision Support System开始在实际生产中广泛应用; 同时工业界也提出了数据仓库的思想,以IBM公司的“Information Warehouse”为代表。 80年代中期: OLTP、MIS/DSS快速发展; 但由于受当时技术和实现费用的影响,数据仓库的思想没有引起太多学者和工业界的关注。 §13.1 数据库技术的发展 数据库技术发展的里程碑 90年代早期: 以数据仓库之父W.H.Inmon为代表的数据仓库(Data Warehouse,简称DW)研究的兴起; 迅速在OLAP-Online Analysis Processing、DM-Data Mining和OLAM-Online Analysis Mining等方面取得进展。 90年代中期: 由于数据质量等原因,大多数DW和DM项目以失败而告终。 90年代后期: 数据库研究人员开始艰难寻找新的方向…… §13.2 数据仓库的概念 什么是数据仓库? Inmon在Building the Data Warehouse一书中对“数据仓库”定义如下: 数据仓库是 面向主题的 集成的 稳定的 不同时间的  数据集合,用以支持管理决策。 这个定义本身就说明了数据仓库中数据的组织方式以及建立数据仓库的目的。 §13.2 数据仓库的概念 什么是数据仓库? 数据仓库中的数据是面向主题的: 主题是数据归类的标准; 每个主题对应一个客观分析领域,可为辅助决策集成多个部门不同系统的大量数据。例如: 对一个保险公司来说,它的业务应用系统可能有汽车保险、人寿保险、健康医疗保险及家庭财产保险等,而保险公司的主题领域可以是客户、保单、保费及索赔等。 §13.2 数据仓库的概念 什么是数据仓库? 数据仓库中的数据是集成的: 不同的应用在编码、命名、属性度量等方面有很大的差别,数据集成就是要解决这些问题。 §13.2 数据仓库的概念 什么是数据仓库? 数据仓库中的数据是稳定的: 数据仓库包含了大量的历史数据,经集成进入数据仓库后主要用于决策分析,而极少更新。 §13.2 数据仓库的概念 什么是数据仓库? 数据仓库中的数据是不同时间的: 数据仓库内的数据时限至少为5到10年,主要用于进行时间趋势分析;而一般业务数据库的时限为1个月至1年,有的甚至更短。 §13.2 数据仓库的概念 建立数据仓库的目的 主要是为企业或政府的管理决策服务的,因此,数据仓库主要应用在两个方面: 使用数据仓库前端的浏览分析工具在数据仓库中查找有用的信息; 基于数据仓库,在数

文档评论(0)

sandaolingcrh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档