基于数据立方的视图选择-计算机软件与理论专业论文.docxVIP

  • 2
  • 0
  • 约5.94万字
  • 约 66页
  • 2019-03-30 发布于上海
  • 举报

基于数据立方的视图选择-计算机软件与理论专业论文.docx

华中科技大学硕士学位论文fl 华中科技大学硕士学位论文 fl 捅 安 (联机分析处理(OLAP)按照数据立方模型组织多维数据,从而方便了OLAP 查询。OLAP查询通常是针对非常大的数据集的复杂查询,如果所有的查询都从原 始数据集进行计算,响应速度太慢,通常人所能忍受的响应时间是非常短的,因此 查询优化就变得十分关键。为了提高查询效率,我们从数据立方中选择合适的视图 然后进行实化计算。、 以前视图选择和数据立方计算两方面的研究是分开的,由于视图选择往往需要 事先估算视图的大小,选择完后还要对所选的视图进行实化,即进行数据立方计算。 基于对视图选择算法PBS和数据立方计算算法BUC的研究,我们把这两者有机结 合起来,有效提高视图选择的效率和准确性。 PBS在满足存储空间的限制条件下,依照聚集视图大小的升序从数据立方中选 择视图。BUC是目前适合于稀疏数据立方的有效计算方法,它利用视图间的依赖关 系自底向上计算聚集视图。PBS进行视图选择之前需要预先计算视图的大小,我们 对BUC改进,提出BUCC算法计算视图大小,实验表明BUC大约70%时间用在 聚集计算结果的输出上,BUCC不输出结果,只进行计数计算,能快速准确的计算 出每个视图的大小。然后PBS根据视图大小选择需要实化的视图,它的特点是在数 据立方的格表示上,一个结点被选中,那么它的所有子结点必然已被选中,选择完 后,就在数据立方格上生成了一条预计算边界线,边界线以下的就是被选中的视图。 最后再次改进和扩展BUC,提出PBUC算法实化这些视图,在自底向上计算的过程 中,只需在数据立方格的预计算边界线处终止递归,裁剪掉边界线以上的聚集计算, 依此就可以完成部分视图实化的任务。PBS和BUC两者配合效果极好,有效地提 高了视图选择的效率和准确性,从而大大提高OLAP查询效率。 关键词: 联机分析处理:数据立方;视图选择;聚橥 华中科技大学硕士学位论文ABSTRACT 华中科技大学硕士学位论文 ABSTRACT Data cube organizes enterprise historical data in a multidimensional way which is in favor of On.Line Analytical Processing.OLAP usually involves complex queries on very large multidimensional datasets,it takes long time if all queries get response from raw datasets.Thus,queries optimization is critical.To get the high effiency of queries,we select some appriorate views ofthe data cube and materialize them. There are two research aspects in OLAP:data cube computation and views selection, which are studied separately before.We need compute the size of every cells of data cube before views selection and compute the cells ofthe data cube after views selection.Based on studies on views selection algorithm PBS and data cube algorithm BUC,we combine the two algorithms together only tO get high performance of views selection. Since views selection algorithm PBS bouom·up chooses the views by the increasing size of the views in data cube under the space constraint.Data cube algorithm BUC is most proper to compute sparse data cube currently,which bottom·up computes all cells of the data cube based on the dependence relation on cells.The two algorith

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档