分步骤建立数据集市集成企业级数据仓库-2019年文档.docVIP

分步骤建立数据集市集成企业级数据仓库-2019年文档.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分步骤建立数据集市集成企业级数据仓库   Step-by-step Establishment of Data Marts Integrated Enterprise-level Data Warehouse   WANG Jing-ting   (College of Information Engineering, Xian Fanyi University, Xian 710105, China)   : The paper analyses the basic structure of data warehouse and the differences of data warehouse and data marts,gives the basic ideas that step-by-step establishment of data marts integrated enterprise-level data warehouse from the actual conditions and forms the three-tier data warehouse architecture with the plan of data warehouse and data marts and end-user.   面对当今竞争日趋激烈与瞬间万变的市场经济,各级管理人员迫切需要面对不同层次的大量信息做出抉择。这就要求各级管理人员能够从大量复杂的业务数据中获取各自权限内的决策信息,及时准确地把握市场变化的脉搏,做出正确有效的判断和抉择。从各级决策者的角度来看,为了对整个组织的业务、需求及未来趋势进行一个全面的分析,则不仅要求访问数据库的当前数据,还需要访问一些历史数据。为了能方便地进行这种分析,数据仓库应运而生。   数据仓库就是针对解决上述问题所产生的一种技术方案,是基于大规模数据库的决策支持系统环境的核心。数据仓库是以关系数据库、并行处理技术和分布式技术为基础的新的数据处理技术。   数据仓库是一个面向主题的、集成的、时变的、非易失的数据的集合,用以支持决策支持系统。然而,建立一个企业范围的数据仓库是一项重大的工程。从概念化到实现,可能需要数年时间、需要大量的人工参与、大量的财力耗费及其大量的设备的投入、复杂的外部数据源使得数据的装载过程变得困难、数据所有权问题、终端用户的需求不断增长、集成的复杂性等等多方面的困难的存在往往使得企业直接建立数据仓库工程变的力不从心。因此,从企业实际情况出发,分步骤部门级数据仓库――数据集市,不失为一个较好的选择。尤其对于那些迫切需要支持OLAP 、DSS和数据挖掘的企业。   数据集市是小型的、面向部门或工作组级的数据仓库,不同的数据集市可以按业务的分类来组织,也可以按照数据仓库的主题或数据的地理分布来组织。   从企业实际情况出发,分阶段建立数据集市以适用核心部门级数据决策的需要,考虑到整个企业范围内分析主题的扩展性,最终实现数据仓库+数据集市体系结构是最终实现企业范围内数据仓库的最佳方案。   1 数据仓库的体系结构和数据模型   1.1 体系结构   数据仓库构建了一种以集中式的数据存储为核心的体系结构,数据存储的模式为了适应决策分析的要求,从而形成了一种与原来业务系统构成的操作型环境(OLTP)相独立的决策支持环境。数据仓库最基本的体系结构如图1所示。   1.2 数据模型   两种常见的数据仓库数据模型是星型模型和雪花模型。星型模式是由一个事实表和每个维对应的一个维表组成,在星型模型中,事实表包含事实数据,它通常采用组合主键,其中的每一个分量通过外键和维表关联。如图2所示。雪花模型是星型模型的一种变种,这种模型中允许维中还包含多个维,如图3所示。由此可见,雪花模型对星型模型的维度表进一步标准化,对星型模型中的维度表进行了规范化处理。   2 构建部门级数据仓库   2.1 数据集市和数据仓库的不同点   数据集市是轻量级数据仓库,数据集市可独立存在,也可依赖于数据仓库。当数据仓库越变越大时,其满足组织各种需要的能力就要进行折中。因此,之所以建立数据集市是由于前人的实践已表明,使用组织数据仓库是很困难的。   数据集市与数据仓库的不同在于:   1)数据集市只考虑某一个部门或某一商业功能用户的需要。   2)数据集市不像数据仓库那样,它一般不含业务层细节数据。   3)数据集市所含的数据量比数据仓库少,所以易于理解和操纵。   2.2 创建数据集市的原因   建立数据集市的主要原因有如下几点:   1)让用户访问他们经常分析的数据;   2)提供的数据以部门视图的形式呈现给用户;   3)通过减少访问的数据量来减少终端用户

文档评论(0)

150****8484 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档