数据立方体优化技术研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
--优秀硕士毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文的提供参考!!!

摘要 数据立方体是数据仓库和联机分析处理的核心概念。为提高联机 分析处理系统的查询性能,通常需要预先计算并保存数据立方体,然 而完全的预计算必将导致数据立方体体积的爆炸。因此,降低磁盘空 问成本和提高查询性能成为数据立方体研究两个重要却又相互制约 的目标。为从根本上解决这些问题,需要探索有效的数据立方体组织 方法。 本文首先提出基于语义压缩的同基类数据立方体概念,它将由相 同基本元组集聚集而来的立方体元组归为一类,称之为同基类,该 类中所有立方体元组的聚集值定然相同,仅从每类中选出一个代表 进行实际物理存储,从而大大降低数据立方体的空间开销。另一方 面,因为类中元组都是基于相同的基本元组集在不同的维集上进行 聚集计算,所以这些元组也保存了原有数据立方体的语义信息。在 此基础上,将同基类数据立方体中的元组按树状结构组织成同基类 方体树,不但进一步减少了数据立方体的物理存储空间,也提高了 其点查询性能。 当前数据立方体在处理一个区域查询时,都是将其分解成大量 点查询,对各点进行点查询后再汇总聚集得到结果,而一个区域查 询分解成的点查询个数是查询条件中各维区间分解点数目的乘积, 从而导致区域查询效率较低。对此,本文提出一种基于集合运算的 数据立方体结构,通过索引和集合的交并运算来加快区域查询,在 查询条件为区域的维上,先对区间中各维值的基本元组索引集进行 并运算,然后一次性的进行所有维集合的交运算,从而在保持较少 的磁盘空间和较好的点查询响应速度的情况下,改善了区域查询的 性能。 关键词OLAP,数据立方体,同基类,方体树,集合运算 ABSTRACT on。line Datacubeisthekernel ofdatawarehouseand conception to andsave needs analytical usually pre—compute processing(OLAP).It thedatacubeindiskfor the thesizeofdatacube speedingup queries.But will when area11 andsaved.To increase explosivelytlley pre—computed decreasediskcostand are veryimportant improvequeriesperformance thesakeof butcontradictiveofdatacuberesearch.For goals resolving these needsto theeffectivedatacubestructures. problems,itexplore Anewdata structurenamedIso-Basictable cube Cube(IBC)is of

文档评论(0)

liyxi26 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档