- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
学 号 姓 名 :赵海红 提纲 数据仓库的实质与价值 数据仓库新的应用与环境 数据仓库的模型与设计方法 传统的数据仓库体系结构及其改进 数据仓库的操作问题 展望 提纲 数据仓库的实质与价值 数据仓库新的应用与环境 数据仓库的模型与设计方法 传统的数据仓库结构及其改进 数据仓库的操作问题 展望 数据仓库的实质与价值 数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision-Support)。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因此数据仓库的基本架构主要包含的是数据流入流出的过程,可以分为三层——源数据、数据仓库、数据应用: 数据仓库的实质与价值 从图中可以看出数据仓库的数据来源于不同的源数据,并提供多样的数据应用,数据自下而上流入数据仓库后向上层开放应用,而数据仓库只是中间集成化数据管理的一个平台。 数据仓库从各数据源获取数据及在数据仓库内的数据转换和流动都可以认为是ETL(抽取Extra, 转化Transfer, 装载Load)的过程,ETL是数据仓库的流水线,也可以认为是数据仓库的血液,它维系着数据仓库中数据的新陈代谢,而数据仓库日常的管理和维护工作的大部分精力就是保持ETL的正常和稳定。 数据仓库的价值 高效的数据组织形式 时间价值 集成价值 历史数据 提纲 数据仓库的实质与价值 数据仓库新的应用与环境 数据仓库的模型与设计方法 传统的数据仓库结构及其改进 数据仓库的操作问题 展望 数据仓库新的应用领域 随着数据仓库的技术的发展和普及,将来可能在以下俩方面提出新的发展瓶颈和挑战: 首先,是对新数据类型的出现,提出新的数据仓库技术对其支持 非传统的系统架构和新的需求,在数据仓库技术中可以找到好的解决办法 空间数据仓库 随着移动互联网和基于位置服务的发展,同时卫星遥感,GPS,医药成像以及其他空间可计算工具获得数据的普及,我们获取了大量的关于时空的数据。但是,这些数据的结构复杂,数据量大的特点,对其处理和分析的技术还有一定的欠缺,近年来,提出了空间数据仓库的概念,现在已经存在了几个大型的空间数据仓库。例如美国的联合国环境规划署(EP) 空间数据仓库 空间数据仓库是融合了数据仓库跟空间数据库技术,利用这两种技术提高了对大量空间数据的处理、分析、管理的能力,但是现在还是存在一下几种挑战: 空间数据粒度的划分 空 间数据的分割 空间数据的集成 当前数据仓库的数据模型标准化推广 空间DW对决策系统的支持 对空间DW的多维度表示 Web数据仓库 Web数据仓库 本体数据仓库 本体数据仓库 其他领域数据仓库 生命科学数据仓库 模式数据仓库 数据仓库新的应用环境 业务流程数据仓库 数据流,实时动态数据仓库 数据仓库与云计算 提纲 数据仓库的实质与价值 数据仓库新的应用与环境 数据仓库的模型与设计方法 传统的数据仓库结构及其改进 数据仓库的操作问题 新的挑战 数据仓库模型与设计方法 数据仓库建立模型的过程实际上是一个从关系型、规范式的数据模型向多维模型转换的过程。其中数据仓库建模和数据仓库开发方法是数据仓库的构建过程中最为关键的技术环节,它直接决定数据仓库构建的成败。 数据仓库建模 ①概念建模 概念建模为数据仓库的设计提供了一个高层次的抽象,从各个方面描述了数据仓库的过程和体系结构,从而完成数据仓库的实施。通常,借助于图形表示法能让设计者和商业用户更方便的对概念模式进行表达、理解和管理。现有的方法可以分为三类:扩展ER模型;扩展UML模型;特殊的模型。当前概念模型存在的问题有以下: 缺乏标准 概念模型安全问题 Mining-aware design 逻辑建模 ②逻辑建模 逻辑建模的总体任务是将概念模型转换成逻辑模型。在数据仓库领域,目标数据库系统通常要么是关系型的,要么是多维的。对于关系型的而言,人们普遍采用所谓的星型、星座和雪花模型来处理数据立方体,并且各个厂商也对这些模型提供支持。关于多维模型的实施,人们提出几种有效的多维数据结构,如浓缩数据立方体来管理数据立方体。当前逻辑模型最大的存在问题: 概念数据模型与关系或者数据立方多维实现的语义差别的问题 物理建模 ③物理建模 根据逻辑模型设计阶段的星型模型或雪花模型能够方便地定义物理数据结构,一般将指标实体转化为物理数据库表,称为事实表。事实表首先包括星型模型中心的指标量,其次应包括星型模型角上的维度实体中层次最低单位的主码。维度实体通常也转化为维数据库表,称为维表,它包括其每一层次的主码和对应的值。维表的关键字是该维
您可能关注的文档
最近下载
- 牛奶过敏的诊断、管理和预防意见书(2024).pdf VIP
- 西安2初一新生分班(摸底)数学模拟考试(含答案).doc VIP
- 2025年新版人教版四年级上册英语 四上Unit 4 Helping in the community单元整体教学设计.pdf VIP
- 中国碳化钨项目创业投资方案.docx VIP
- 内能的利用的学案.doc VIP
- 建筑与市政工程防水通用规范试题(含答案).doc
- 《中国儿童生长激素使用情况研究》.pdf VIP
- 万华化学经营分析报告.docx VIP
- 2025年中国PVB中间膜项目商业计划书.docx VIP
- 政府间国际科技创新合作重点专项2017年第二批项目.doc VIP
文档评论(0)