数据仓库的查询算法与联机研究处理的分析.pdf

数据仓库的查询算法与联机研究处理的分析.pdf

中文摘要 为了能更好地支持决策分析,发挥数据的更大价值,数据仓库技术应运而生。其 中,联机分析处理(OLAP)是数据仓库最主要的应用之一。本文从提高数据仓库和 OI,AP系统性能的角度出发,讨论了基于关系存储的多表连接、分组聚集算法;研究 了目前数据仓库系统比较流行的索引技术;在此基础上提出了新的分组聚集算法:-fi‘ 且在OLAP查询系统的实际丌发中使用了上述技术,取得了预期的效果。 /基于关系存储的联机分析处理(ROLAP)通常会涉及多表连接操作。由于基于关系存 储的数据仓库一般采用星型结构组织数据,所以传统的多表连接方法已经不太适合 ROLAP查询的需要。本文研究了目前较新的多表连接方法,例如多表哈希连接算法、 多表排序连接算法、基于位图索引的多表连接算法等,并加以实现和改进。我们对以 上算法在大数据集上进行测试,测试结果表明新算法在性能上有了显著地提高。 有了有效的多表连接操作,ROLAP查询就可以进行分组聚集了。分组聚集操作对 查询结果进行分组,然后钏‘对每个组进行聚集,以得到一些概化的结果,为JH户提供 决策支持。分组聚集操作在ROLAP查询中占有相当重要的位置。本文首先介绍了螭丁 捌序的聚集算法MuSA,该算法采用关键字映射技术排序,获得高效聚集

文档评论(0)

1亿VIP精品文档

相关文档