数据仓库结构设计和物化视图选择.pdf

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
上海大学硕士学位论文 The Thesis Postgraduate ofShanghaiUniversity 摘 要 为了推进数据仓库的应用和解决实际项目中遇到的问题,我们进行了数据仓库的 理论研究。建立数据仓库的主要目的就是提供集成一致快速的分析环境。查询是分析 的基础,利用物化视图,可将查询结果或中间结果预先计算并物理地存储起来以提高 查询的效率。因此在数据仓库中,物化视图不再是一种补充或附属成分,而是基本的 结构成分。数据仓库可以抽象地看成定义在多个分布式、异构数据源上的物化视图的 集合。物化视图集合决定了数据仓库的主要结构,因而我们以“数据仓库结构设计与 物化视图选择”为研究课题,探索将物化视图选择理论用于数据仓库结构设计的途径。 本文在对现有数据仓库的概念、特征、数据组织结构和设计方法进行分析的基础 上,提出了一种数据仓库体系结构,将数据仓库分析环境中的数据划分为核心数据、 全局扩展数据、局部扩展数据和私有扩展数据四类,并分别对这四类数据的结构设计 问题进行了研究,将物化视图选择理论用于后三类扩展数据的结构设计中。本文针对 现有物化视图选择理论在数据仓库工程实践中面临的困难,提出了查询泛化的概念, 并给出了两种查询泛化的算法;在此基础上,针对各类扩展数据的特点,恰当地选择 和改进物化视图选择问题上的现有理论成果,进行数据仓库的结构设计。 数据仓库的结构应该与用户的分析需求相适应,而后者是复杂多变的,当用户的 分析需求变化超出某一限度时,需要对数据仓库的结构作恰当的调整,很明显的一种 选择就是重新执行物化视图选择算法,形成新的物化视图集,但这带来的问题是无法 控制调整量,而重建物化视图的开销极大,因此本文提出了在限定调整量的情况下, 如何对物化视图集作局部调整的问题,并给出了相应的算法。 最后,本文介绍了上述研究成果应用于上海一家大型超市数据仓库系统中数据集 市部分的设计概况和部分细节,并对研究工作进行了总结和展望。 关键词:数据仓库,结构设计,物化视图选择,核心结构,扩展结构,查询泛化 遗传算法,半物化视图,贪心算法 第 1 页 上海大学硕士学位论文 The Thesis PostgraduateofShahghai University ABSTRACT To the ofdata solvethe in warehouse(DW)and pushpracticality problemproject,we DW.Themain of DWisto an to the study purposebuilding provideintegrated begin consistentandfastenvironmentfor baseson analysisapplications.Analysisusually query. resultsof are and InDW.theresultsorintermediatequeriespre-computedphysically inmaterialized the of the stored

文档评论(0)

ww88666 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档