- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 数据仓库设计与开发 本章目标 了解数据仓库开发应用过程 熟悉数据仓库的规划内容、目标等 掌握数据仓库的分析与设计过程、内容 了解数据仓库的实施过程 第四章 数据仓库设计与开发 本章内容 4.1 数据仓库开发应用过程 4.2 数据仓库的规划 4.3 数据仓库的分析与设计 4.4 数据仓库的实施 4.5 数据仓库技术与开发的困难 4.1 数据仓库开发应用过程 数据仓库的开发应用像生物一样具有其特有的、完整的生命周期,数据仓库的开发应用周期可以分成三个阶段: 数据仓库规划分析 数据仓库设计实施 数据仓库使用维护 这三个阶段是一个不断循环、完善、提高的过程(螺旋式)。 螺旋式开发应用过程 4.2 数据仓库的规划 选择数据仓库实现策略 自顶向下:实际应用比较困难 。 自底向上:用于一个数据集市或一个部门的数据仓库开发 ,容易获得成功 。 两种策略的联合使用 :能够快速地完成数据仓库的开发与应用,而且还可以建立具有长远价值的数据仓库方案。在实际使用中难以操作 。 用自顶向下方法 建造企业数据仓库 建设中心数据模型 一次性的完成数据的重构工作 最小化数据冗余度和不一致性 存储详细的历史数据 从企业数据仓库中建造数据集市 得到大部分的集成数据 直接依赖于数据仓库的可用性 问题 投资效益的时间? 建设中心数据模型的必要性和可能性? 初始费用 ? 用自底向上方法 建立部门数据集市 限制在一个主题区域 快速投资收益 区域自治 – 设计的可伸缩性强 对相关部门的应用容易复制 对每个数据集市需要数据重构 存在一定的冗余及不一致性 逐步扩展到企业数据仓库 (EDW) 把建造EDW作为一个长期的目标 存在的问题: 数据集市的数据都是可用的吗? 能生成数据模型吗? 如何解决不一致性? 采用从顶向下 VS 从底向下 企业内部、各个业务部门和各个工作岗位对数据仓库的理解和期望不同。作为具体的部门,有特定的信息需求,都希望能在尽可能短的时间内需求获得满足。建立局部的系统,所需信息能够立即为其使用。因此对部门而言,他们追求的是一种短期的局部目标,关心的是基于所在位置的局部解决方案。 整个企业看,建立数据仓库的目的之一是获得对整个企业业务信息的视图。以便能把握和管理企业的经营运行,并对企业进行业务重组。 企业现有系统往往不同程度上存在各自为政,缺乏统一的规划和设计。数据出自各部门,提供的信息不一致,使得高层无法获得可靠、统一和协调的信息。 企业追求的是长期的集成目标,关心的是基于整个企业的全面解决方案。 两者的目标是有矛盾的! 4.3 数据仓库的分析与设计 4.3.1 需求分析 4.3.2 概念模型设计 4.3.3 逻辑模型设计 4.3.4 物理模型设计 4.3.1 需求分析 确定主题域 支持决策的数据来源 数据仓库的成功标准和关键性能指标 数据量与更新频率 确定主题域 (1)明确对于决策分析最有价值的主题领域有哪些? (2)每个主题域的商业维度是哪些?每个维度的粒度层次有哪些? (3)制定决策的商业分区是什么? (4)不同地区需要哪些信息来制定决策? (5)对哪个区域提供特定的商品和服务? 支持决策的数据来源 (1)哪些源数据(操作型)与商品主题有关? (2)在已有报表和在线查询中得到什么样的信息? (3)提供决策支持的细节程度是怎样的? 数据仓库的成功标准和关键性能指标 (1)衡量数据仓库成功的标准是什么? (2)哪些关键的性能指标?如何监控? (3)对数据仓库的期望是什么? (4)对数据仓库的预期用途有哪些? (5)对计划中的数据仓库的考虑要点是什么? 数据量与更新频率 (1)数据仓库的总数据量有多少? (2)决策支持所需的数据更新频率是多少?时间间隔是多长? (3)每种决策分析与不同时间的标准对比如何? (4)数据仓库中的信息需求的时间界限是什么? 开发模型 模型是对现实世界进行抽象的工具。 在信息管理中需要将现实世界的事物及其有关特征转换为信息世界的数据才能对信息进行处理与管理,这就需要依靠数据模型作为这种转换的桥梁。 这种转换一般需要经历从现实到概念模型,从概念模型到逻辑模型,从逻辑模型到物理模型的转换过程。 4.3.2 概念模型设计 概念模型的特点是: 能真实反映现实世界,能满足用户对数据的分析,达到决策支持的要求,它是现实世界的一个真实模型。 易于理解,便利和用户交换意见,在用户的参与下,能有效地完成对数据仓库的成功设计。 易于更改,当用户需求发生变化时,容易对概念模型修改和扩充。 易于向数据仓库的数据模型(星型模型)转换。 概念模型表示 概念模型最常用的表示方法是实体-关系法(E-R法)。 E-R图将现实世界表示成信息世界,便利向计算机的表示形式进行转化。 建立概念模型:对每个决策主题与属性以及主题之间的关系用E-R图模型表示。
您可能关注的文档
最近下载
- 新版部编版四年级上册道德与法治全册教案(最全).doc VIP
- N MX曳引机轴承更换步骤.pdf VIP
- 古诗词诵读《将进酒》课件(共20张PPT)统编版高中语文选择性必修上册(内嵌音频+视频).pptx VIP
- 公文办理情况的报告.docx VIP
- 吊装专项施工方案.doc VIP
- 9《天上有颗“南仁东星”》课件(内嵌音频+视频).pptx VIP
- 003-02风力发电机组振动状态监测导则.pdf VIP
- APQP 先期产品质量策划(第三版)2024 中英文(高清可复制).doc VIP
- DZ∕T 0453.1-2023 铌钽矿石化学分析方法第1部分:铌、钽和钨含量的测定封闭酸溶-电感耦合等离子体原子发射光谱法.pdf
- 2《中国人首次进入自己的空间站》课件(含23张ppt).pptx VIP
文档评论(0)