多维数据模型与数据立方体技术的分析.pdf

摘要 摘要 多维数据模型和数掘立方体技术是联机分析中两项关键技术。目前,联机分析产品 支持的数据模型不能很好的描述一些复杂应用,缺乏理论基础。另外,在原始数据很大、 维数多、有大量维成员的情况下,如何有效的减少数据立方体的体积,快速计算数据立 方体仍然是一个十分重要的研究课题。本文针对这两个问题进行了研究。 本文提出了基于扩展关系模型的多维数据模型ER(如。ER(JO把维表示成半结构化 数据,路径表达式作为查询语言‘,使得维可以用做关系模型的域;去掉关系模型中第一 范式的限制,允许属性的值可以是多值;扩展了关系代数。ER(卿可以充分利用在关系 模型、面向对象模型以及半结构化数据方面的研究成果,易于在主流的关系对象数据库 系统上实现。 通过把数据立方体中的维分为划分维和非划分维,定义了一个等价关系,使得具有 相同划分维的视图构成了一个等价类。把等价类组织成主流水线,等价类中的视图组织 成次流水线,给出了两层流水线数据立方体串行算法和并行算法,可以充分的利用物理 内存,大大减少读原始数据的次数和处理机之间的通讯开销,缩短了计算时膪J。 本文提出了星型数据立方体实例化视图选择方法。在星型数据立方体中,

文档评论(0)

1亿VIP精品文档

相关文档