2018年6月29日星期五 Data Mining Concepts and Techniques.pptVIP

  • 5
  • 0
  • 约8.08千字
  • 约 37页
  • 2018-06-29 发布于湖北
  • 举报

2018年6月29日星期五 Data Mining Concepts and Techniques.ppt

* Data Mining: Concepts and Techniques * 数据立方的有效计算 数据立方可以看作是由立方体形成的格结构 最底层的立方体称为基本方体(base cuboid) 最上层的方体称为顶点方体 (apex cuboid) 一个L层的n维立方有多少立方体呢? * Data Mining: Concepts and Techniques * 数据立方的物化 物化每一个立方体, 不物化, 或者部分物化 物化每一个立方体? 不物化? 部分物化! 选择将要物化的立方体 基于尺寸大小, 共享, 访问频率等。 * Data Mining: Concepts and Techniques * 立方计算的多路数组聚集方法 I 把数组划分成块(chunks,一个子方,其大小能够放入立方体计算时可用的内存). 采用压缩的稀疏数组结构: (chunk_id, offset) 通过访问立体单元,计算聚集。可以优化访问单元的次序使得每个单元必须重复访问的次数最小化。 * Data Mining: Concepts and Techniques * 立方计算的多路数组聚集方法 II A B 29 30 31 32 1 2 3 4 5 9 13 14 15 16 64 63 62 61 48 47 46 45 a1 a0 c3 c2 c1 c 0 b3 b2 b1 b0 a2 a3

文档评论(0)

1亿VIP精品文档

相关文档