企业数据模型到数据仓库数据模型的步骤.ppt

企业数据模型到数据仓库数据模型的步骤.ppt

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
企业数据模型到数据仓库数据模型的步骤

企业数据模型转换到数据仓库数据模型的步骤 企业数据模型 企业数据模型是指从整个企业业务的视角,对企业业务活动相关数据采用数据建模方法构造的模型。 企业数据模型是对企业业务的核心数据的抽象,它不是信息化系统实施所需的全部细节数据的数据模型。 企业数据模型不随企业职能域的改变而变化,它独立于企业的应用,是企业信息化应用建设的基础 。 数据仓库 数据仓库是一个面向主题的、集成的、非易失的,随时间变化的用来支持管理人员决策的数据集合。 数据仓库的特点 面向主题性 数据以所代表的业务内容划分,而不是以应用划分。 集成 数据仓库中的数据从多个不同的数据源传送来。 数据仓库的特点 非易失性 数据仓库的数据通常以批量方式载入与访问,但在数据仓库环境中并不进行数据更新,只允许加载和查询操作。 随时间变化 数据仓库中的每个数据单元只是在某一时间是准确的,有些情况下记录中加有时间戳,而在另外一些情况下记录则包含一个事务的时间。 企业数据模型转换到数据仓库数据模型的步骤 选择感兴趣的数据 在键中增加时间 增加派生数据 确定粒度级别 汇总数据 合并实体 建立数组 分离数据 选择有兴趣的数据 主要原因 把数据仓库项目的目的和企业目标作为前景,在涉及数据仓库建模的所有决定中都考虑了企业目标和目的。 把数据仓库模型的范围限定为刚好满足项目的需要。 选择有兴趣的数据 在操作系统中,数据元素分三组 肯定需要的元素 肯定不需要的元素 可能需要的元素 选择有兴趣的数据 选择处理过程考虑三方面的因素 使用数据元素生成派生字段 划分事务型数据和参照型数据 源数据结构 使用数据元素生成派生字段 通常的规则 用于计算派生字段的每个元素都应该包含在数据仓库中。 原因 用于计算所需要的数据元素的算法可能会改变,并且通过保留这些独立的元素,派生字段可以根据当前视图和历史视图的需要重新进行计算。 当企业用户分析结果时,尤其是派生元素的值是一个意想不到的值的时候,他们已经钻研用于计算某个所需字段的数据。 划分事务型数据和参照型数据 通常的规则 对于事务型数据,如果我们无法确定,就应该引入它。 对于参照型数据,如果对是否要包括一个数据元素有异议,通常倾向于排除它。 源数据结构 如果一个源数据表中的绝大部分列都需要,那么应该考虑包括进所有的元素。 如果仅仅需要一个源数据表中很少的几列,那么应该倾向于排除其他的列。 企业数据模型转换到数据仓库数据模型的步骤 选择感兴趣的数据 在键中增加时间 增加派生数据 确定粒度级别 汇总数据 合并实体 建立数组 分离数据 在键中增加时间 企业数据模型是一种“时间点”模型,这种模型实时地描述业务。 数据仓库数据模型是一种“时间段”模型,它用历史视图来描述一个企业。 在数据模型中为每个实体增加时间成分(日期、时间)以提供历史视角。由于对每个实体的键都要求加入时间成分,因此所包括的历史数据中的一些一对多的联系也变成了多对多的联系。 在键中增加时间 实体的时间成分只能采用两种形式中的一种 对于快照数据,加入到键中的是一个时间点,如日期。 对于属于一段时间的数据,加入到键中的就是时间段。 尽管在理论上建议时间成分应该加入到每个实体键中,但是如果数据从来不改变,就不可能有任何历史数据,因而也就有了例外。 收集历史数据的方法 生成一个双外键。 收集历史数据的方法 为每个实例在父亲实体中生成一个顺序键,并在父亲实体内将该实例的标识符和时间成分作为非键属性存储。 收集历史数据的方法 有计划地实施参照完整性,而不是使用DBMS来实施它,并且针对标识符实施参照完整性。 收集历史数据的方法 将数据分离为一个包含历史数据的实体和一个只包含当前数据的实体。 收集历史数据的方法 维护基本实体,基本实体内的数据元素从不改变,并且为随时间变化的属性创建一个属性的实体。 收集历史联系 联系也会随着时间而改变。这些改变的结果是创建多对多的联系。在第三范式模型内,可预测的层次结构是通过一系列的实体来体现的,这些实体具有连续的一对多联系。 收集历史联系 这种情况可以用两种方法来处理 插入一个关联型实体来解决多对多的联系 从父亲实体到子实体的日期级联得到父亲节点数据的改变和联系的改变 方法依赖于两个主要因素 层次结构的层次数。 实体型数据与联系型数据的相对稳定性。 关于多维模型的考虑 在E-R模型中,可以收集到每一个有意义的历史事件,并且这些事件很容易与相关的业务项联系起来。在多维模型中,对历史数据的处理依赖于其是否与事务有关或者与参照型数据有关。在一个由维表覆盖的层次结构中,对数据或联系的任何有意义的变化都要求设置另外的入口项,并创建一个缓变维 。 企业数据模型转换到数据仓

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档