第4章 数据仓库的设计、开发与应用.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章 数据仓库的设计、开发与应用

第4章 数据仓库的设计、开发与应用 第4章 数据仓库的设计、开发与应用 ? 4.1 数据仓库设计 ? 4.1 数据仓库设计 数据仓库是体系化环境的核心, 它是建立决策支持系统 (DSS) 的基础。所以建设数据仓库就成了建设企业的体系化环境的中心问题。 如何建立并建好一个企业的体系化环境, 关键是要建立、建好企业的数据仓库。 在这一节里, 我们将讨论以下有关内容: 数据仓库的系统设计方法 ? 建设数据仓库的三级数据模型 ? 如何提高数据仓库的物理性能 力图给出一个可操作的数据仓库设计步骤 ? ? 系统设计方法概述 ? 4.1 ? 数据仓库系统设计方法概述 第一章里说明了数据仓库是一个面向数据分析型处理的数据环境。 数据仓库的数据具有四个基本特征: ? 面向主题的 ? 集成的 ? 不可更新的 ? 随时间不断变化的 这些持点说明了:数据仓库从数据组织到面向的数据处理都跟原来的数据库有较大区别。 这决定了:我们在进行数据仓库系统设计时, 不能够照搬原来传统的数据库系统开发方法, 因而需要寻找一个适于数据仓库设计的方法。 ? 系统设计方法概述 ? 4.1 ? 数据仓库系统设计与数据库系统设计的不同主要表现在以下几个方面: ⑴ 面向的处理类型不同 ? ⑵ 面向的需求不同 ? ⑶ 系统设计的目标不同 ? ⑷ 两者的数据来源或系统的输入不同 ? ⑸ 系统设计的方法和步骤不同。 ? “数据驱动” 的系统设计方法的特点 ? ⑴ 是以数据为基础 ? ⑵ 是进行面向应用到面向需求的转变 ? ⑶ 是一个逐步提高决策效果的循环过程 ? ? 系统设计方法概述 ? 4.1 ? ? 数据仓库系统与数据库系统设计的主要不同 ⑴ 面向的处理类型不同 操作型数据库系统设计是建立一个操作型的数据环境, 其设计方式是面向应用的, 即一般是从某一或某些具体应用出发来进行数据库设计, 然后在数据库上建立起这些应用。 数据仓库的系统设计则是面向分析的, 它的开发往往是从最基本的主题开始, 不断地发展新的主题, 完善已有的主题, 最终建立起一个面向主题的分析型数据环境。 ? 系统设计方法概述 ? 4.1 ? ⑵ 面向的需求不同 面向应用的数据库系统设计有一组较确定的应用需求, 这是数据库系统设计和开发的出发点和基础。 而在数据仓库环境下, 并不存在操作型环境中的固定的且较确切的物流、数据处理流和信息流,数据的分析处理的需求更灵活, 更没有固定的模式, 甚至用户自己也对所要进行的分析处理不甚明了, 因而在进行数据仓库系统设计时, 很难获得对用户需求的确切了解。这就决定了我们不可能从用户需求出发来进行数据仓库的设计。 ? 系统设计方法概述 ? 4.1 ? ⑶ 系统设计的目标不同 设计 OLTP 数据库时, 事务处理性能 (主要表现为事务处理的响应时间) 是系统设计的一个主要目标; 而数据仓库系统设计时, 更应该关心的是建立起一个全局一致的数据环境以作为企业决策支持系统的基础。因而数据仓库设计的一个主要目标是, 保证数据的四个基本特征, 保证数据的全局一致性, 以实现对企业数据的全局管理与控制。 ? 系统设计方法概述 ? 4.1 ? ⑷ 两者的数据来源或系统的输入不同 操作型环境的数据的输入通常来自于组织外部, 设计操作型数据库就是设计如何通过与外部交互得到数据、如何将获得的数据用适当的方式进行存储、如何对数据进行联机的查询更新等操作, 以及如何保证数据的安全可靠与正确有效, 等等。 而数据仓库的数据主要来自于业已存在的系统内部, 设计数据仓库就是要设计如何从现存的数据源中得到完整一致的数据, 如何将所得数据进行转换、重组、综合,如何有效地提高数据分析的效率与准确性等等。 ? 系统设计方法概述 ? 4.1 ? ⑸ 系统设计的方法和步骤不同 操作型环境中, 业务过程和规则比较规范而固定。系统设计人员能够清晰地了解应用的需求和数据流程。系统的设计一般采取系统生命周期法 (Systems Development Live Cycle,SDLC)。 而在分析型环境中, DSS 分析员一般是企业的中上层管理人员, 他们对决策分析的需求不能预先做出规范说明, 只能给设计人员一个抽象的模糊的描述。这就要求设计人员在与用户不断的交流中, 将系统需求逐步明确与完善。人们为突出这种需求不确定的开发过程, 将数据仓库的设计方法描述成 CLDS 方法 ( 与 SDLC 相反)。 ? 系

文档评论(0)

pangzilva + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档