第14章 数据仓库的维护和解决方案课件.pptVIP

第14章 数据仓库的维护和解决方案课件.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第14章 数据仓库的维护和解决方案课件

数据仓库与OLAP实践 清华大学出版社 第14章 数据仓库的维护和解决方案 14.1 更新数据仓库 14.2 维护OLAP数据 14.3 优化数据仓库性能 14.4 数据仓库解决方案 14.5 小结 14.1 更新数据仓库 更新数据仓库数据包括定期从联机事务型系统中析取数据,清理、转换数据以及将新数据加载到数据仓库。 更新数据还包括:在联机分析处理的情况下必须同步完成多维数据集的任务,而且还必须更新所有作为数据仓库一部分的数据集市。 初始数据加载和数据更新的区别 初始数据加载和数据更新之间的一个不同之处在于: 在将数据加载到数据仓库供用户使用之前,应在更新数据上不断地验证引用完整性。 更新通常包括添加和更改维度表以及向事实数据表添加数据行。 在将新更改的数据加载到数据仓库之前,应检查其内部的一致性并且应在数据仓库的当前数据上验证 14.1.1 调度数据更新 用于分析历史业务数据的数据仓库最好由定期更新而非联机数据更新提供服务。 经常更改数据会影响分析过程,因为这要求时间和反复查询来优化和验证结果。 数据仓库的更新频率取决于单位的需要和数据仓库的用途。 典型的更新周期可以是每月、每周或每天。调度数据仓库更新时需要考虑一些事项。 14.1.1 调度数据更新(续) 将数据加载到数据仓库,就是填充将由显示应用程序使用的表,该应用程序使用户可以使用这些数据。 加载数据通常涉及从源操作系统、数据准备区向数据仓库数据库中的表传输大量的数据。 这样的操作会显著增加所涉及的数据库的处理负荷,因此这些操作应在系统相对不忙的时候进行。 此外,还必须协调数据仓库的更新操作与提供数据的显示服务的操作间的关系。 14.1.1 调度数据更新(续) 更改基础数据对多维数据集的影响因使用的多维数据集类型的不同而不同。 例如,MOLAP多维数据集不受基础数据更改的影响,除非重新处理多维数据集。 根据定义的方式,ROLAP多维数据集和HOLAP多维数据集可能会立即受到影响,并要求更新或重新处理以恢复一致性。实时多维数据集是为立即包含新数据仓库数据而设计的。 14.1.2 更新数据集市 在有些数据仓库的实施过程中,数据集市从主数据仓库接收它们的数据,即按自顶向下模式。 而在有些数据仓库的实施过程中,数据集市是在本地更新并向数据仓库数据库提供数据,即按自底向上模式。 如果数据集市设计为与主数据仓库一致,则将更新的数据移入数据集市或从数据集市移出更新的数据都很简单。 使用标准化架构、共享维度和常用事实数据表格式都可以显著减轻数据集市的维护工作。 14.1.2 更新数据集市(续) 如果数据集市从主数据仓库接收数据更新,则可以设计自动化任务, 如果数据集市在本地收集数据并向主数据仓库提供数据,则可能需要将数据集市看成是操作数据源来处理,并在发布数据到数据仓库之前,将数据放入准备区进行清理并在数据仓库上进行验证。 如果数据集市是作为数据仓库的一个完整部分设计和管理,则可以将数据直接从数据集市装入数据仓库数据库。 14.2 维护OLAP数据 14.2.1 数据仓库中的修改 14.2.2 同步OLAP和数据仓库数据 14.2.3 刷新客户端应用程序 14.2.1 数据仓库中的修改 实际应用中通常需要定期向数据仓库中添加数据,以便反映业务活动的最新信息。 但不经常修改数据仓库中现有的数据,而只是在发现数据有错误或者是由于业务变动需要重新构造数据时才修改数据仓库中的数据。这种情况一般是很少发生的。 1. 添加数据 在数据仓库中添加数据时,由于数据与多维数据集分区之间的相互作用,客户端应用程序可以联机使用的多维数据集信息会受到影响。 可以通过仔细地定义分区筛选以及设计同步OLAP 和数据仓库数据的策略,来管理向数据仓库中添加数据所带来的影响。 2. 修改数据 若认真对待数据转换、验证和清理等操作,就可以减少因纠正数据仓库中的错误而进行的修改。企业或其产品的结构若发生改变,也需要对数据仓库中已有的数据进行修改。 例如,将产品重新组织成不同的类别就需要对数据仓库中的数据做重大修改。 在某些情况下,这样的修改可能需要对多维数据集进行重新设计。或者是重新设计维度和处理所有使用那些维度的多维数据集。 2. 修改数据(续) 如果修改事实数据表中的数据而没有对多维数据集进行处理,则会影响对多维数据集查询的准确性。 可以使用“刷新数据”处理选项重新加载多维数据集的数据并重新计算聚合。由于聚合设计保持不变,“刷新数据”处理选项会比完整的“完整处理”处理选项的速度快。 2. 修改数据(续) 即使表结构保持不变,维度层次结构也会受数据仓库维度表中数据改动的影响。 因为维度层次结构基于维度表中成员间的关系,当改变这些关系时(例如,将城市重新组织成不同的销售区域时),必须重新

文档评论(0)

sanshengyuan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档