6 cube maintenance 数据仓储与数据挖掘 教学课件.pptVIP

  • 7
  • 0
  • 约8.62千字
  • 约 39页
  • 2018-01-25 发布于浙江
  • 举报

6 cube maintenance 数据仓储与数据挖掘 教学课件.ppt

6 cube maintenance 数据仓储与数据挖掘 教学课件

Data Mining: Concepts and Techniques Cube Maintenance 当数据源的数据发生变化时,需要对数据方体(采用各种压缩方法缩减后的数据方体)中的数据进行相应的维护。 重新计算:简单方法,计算量太大 增量维护:在已有的数据方体基础上进行调整。 Cube Maintenance 对于不同的聚集函数,增量维护的方法和代价不一样 分布型聚集函数:具有可以累计的特性,非常适合于增量维护。这类函数称为可自维护型(self-maintainable)聚集函数。 代数型聚集函数:可以转化为分布函数,也是可自维护型函数。 整体型聚集函数:在计算的时候需要所有的数据,很难进行增量维护,被称为不可自维护型 Cube Maintenance 大多数增量维护的算法都是针对可自维护型函数。 对不可自维护型函数,通常采用近似的方法,维护一个统计信息,当数据源发生改变的时候,对统计信息进行更新,然后根据更新后的统计信息估计查询结果。 Cube Maintenance 设计增量维护算法的困难主要在于: 要同时支持三种类型的聚集函数。 维护算法的效率必须高于重新计算的效率, 必须能够对增加的数据进行批量更新。 设计好的批量更新算法是至关重要的。 Cube Maintenance 介绍我们自己的一项工作 针对Quotient Cube进行维护 Increm

文档评论(0)

1亿VIP精品文档

相关文档