chapter3数据仓库设计.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
表 3-1 数据仓库项目对照表( 2 ) 项目方法 高度循环性的 DW 开发 项目每六个月交付一次成果,然后继续 逐步交付结果 假设 / 约束 可以得到优秀的员工;最终用户一开始 就能接受特别查询 可以得到优秀员工 角色 用户项目代表 项目经理 数据建模人员 业务分析人员 系统分析员 开发人员 用户 主题事务专家 用户项目代表 项目经理 数据建模人员 业务分析人员 系统分析员 开发人员 用户 主题事务专家 所选的步骤 建模 决策者的需求 主题区分析 源系统分析 最终用户( EU )访问方法设计 EU 访问方法界定 EU 访问方法开发 交换设计 物理数据库设计 DW 开发 DW 填充和实现 建模 DSS 体系结构 决策者的需求 主题区分析 源系统分析 EU 访问方法设计 变换设计 物理数据库设计 DW 开发 DW 填充和实现 除了项目开发计划书外,项目开发小组的项 目规划活动还将产生: ? A. 文档化的业务驱动因素。 ? B. 数据范围。 ? C. 时间范围。 ? D. 业务原因。 ? E. 总体方法。 ? F. 参与者及其作用。 ? G. 假设和约束。 ? H. 项目管理战略。 3.2.1 数据仓库的平台与结构选择 ? 1. 数据仓库的技术平台 ? ( 1 )单层结构:主要是指在数据源和数据仓库之 间共享平台,或者让数据源、数据仓库、数据集 市与最终用户工作站使用同一个平台。 ? ( 2 )客户 / 服务器两层结构:在这类结构中,一 层为客户机,一层为服务器。最终用户访问工具 在客户层运行,而数据源、数据仓库和数据集市 位于服务器上。该技术结构一般用于普通规模的 数据仓库。 ? ( 3 )三层客户 / 服务器结构:这类结构包括基于 工作站的客户层、基于服务器的中间层和基于主 机的第三层。主机(宿主)层负责管理数据源和 可选的源数据转换;服务器运行数据仓库和数据 集市软件,并存储仓库的数据;客户工作站运行 查询和报表运用程序,且还可以存储从数据集市 或数据仓库卸载的局部数据。 ? ( 4 )多层式结构:这是在三层客户 / 服务器结构 上发展起来的数据仓库结构。 2. 数据仓库的体系结构 ? ( 1 )信息获取层:负责数据的收集、提纯、净化 和聚合,以及从组织外部数据源和组织的业务处 理系统中获取数据。 ? ( 2 )信息存储层:提供包含时点信息的单一逻辑 信息,这种数据通常以最分散的方式存放 —— 需 要尽可能使物理设计符合数据模型,这对最终产 生满足各种设计要求的灵活性是十分重要。 ? ( 3 )信息传递层:是数据仓库结构中支持一套共 用的表示工具和分析工具的组成部分。 3. 数据仓库的数据库设计 ? 数据仓库的数据库主要包含存储用户进行决策 分析的数据库和描绘数据的元数据库。 ? 存储用户分析数据的数据库可以采用关系型数 据库、多维数据库和对象数据库实现。 ? 元数据库是数据仓库的灵魂。没有元数据库, 用户就无法对数据仓库数据进行良好的定义、组 织和管理。 3.2.2 数据仓库接口与中间件设计 1. 数据仓库的数据源确定以及与业务处理系统接口 的设计 ? ( 1 )数据仓库的数据源确定 ? 要为数据仓库从数据源中抽取为管理决策分析 所使用的数据源,首先要对所抽取的数据源进行 正确的定义。数据源的定义要确定数据仓库主题 所需各数据源的详细情况,包括数据源所在计算 机平台、拥有者、数据结构、使用该数据源的处 理过程、数据仓库更新计划等。 ? 为了保证数据的更新需要,还需要为数据仓库 中的每个目标列确认它在业务系统或外部数据源 中的数据来源规则,以便利用数据获取中间件, 从源系统中获取数据,并加载到数据仓库中。 ? ( 2 )数据仓库与业务处理系统的接口设计 在确定了数据仓库的数据源以后,就需要考虑 数据仓库与作为数据源的业务处理系统的接口设 计。 ? 由于业务处理系统环境小,各个应用系统都有 自己独立的、特殊的需求,在各自的过程中没有 考虑到以后与其他系统的集成问题,在其基础上 建立的数据仓库需要完成与业务处理系统接口的 设计,所以设计的接口应该具有这样一些功能: ? A. 从面向应用和操作环境生成完整的数据。 ? B. 数据基于时间的转换。 ? C. 数据的聚集。 ? D. 对现有数据系统的有效扫描,以便今后数据仓 库的数据追加。 ? 数据追加的方法主要有: ? A. 对操作型数据打上时间戳。 ? B. 使用系统日志或审计日志。 ? C. 修改程序代码。 ? D. 使用前映像或后映像文件。 2. 数据仓库的中间件设计 ? ( 1 )拷贝中间件,主要有如下 4 种: ? A. 代码发生器。 ? B. 数据复制工具。 ? C. 数据泵。 ? D. 广义数据获取工具和设备。 ? ( 2 )用于数据库访问的网关中间

文档评论(0)

sandajie + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档