第2章 数据仓库和数据挖掘的OLAP技术 数据挖掘:概念与技术 教学课件
全物化方法 全物化是指对维集合的所有可能组合都进行聚集。最为简单的全物化方法是通过计算n维事实表中的元组,依次得到2n个聚集数据并存储到多维数据集中。当数据立方的维数增多,维的层次更趋复杂时,可能的聚集计算量将剧增,导致存储空间爆炸现象的发生。 为降低聚集计算量,减少存储空间的使用,可以采用多种改进方法,根据参与聚集计算的数据的范围分为单个方体的聚集计算和基于依赖关系的聚集计算两类。 * 典型的单方体聚集计算方法是基于数组方式的聚集计算方法,该方法包括四种形式: G-Aggregation M-Aggregation Infix-Aggregation Prefix-Aggregation 单个方体计算方法会进行多次重复的I/O操作,因此计算效率很低。 并不是所有的聚集都需要从基础数据开始计算,利用方体之间的依赖关系从子方体汇总计算父方体可以加速聚集计算的过程。基于该思想的聚集计算方法包括基于排序(sort- based)和基于哈希(hash-based)的算法:PipeSort,PipeHash和Overlap。这类方法先估计数据立方的各种计算方式的代价,确定其计算顺序和导出关系,其目的是使数据立方的计算开销最小。 * 上述聚集计算方法特别指针以ROLAP形式存储的数据立方,适合于MOLAP的经典聚集计算方法是多路数组聚集方法。它在
您可能关注的文档
- 百科知识问答题库--地理历史知识3.doc
- 百科知识问答题库--地理历史知识1.doc
- 百胜-开具销售小票.doc
- 百瑞信托郑州慈善(四川灾区及贫困地区教育援助)公益.doc
- 百色市中职学校师资队伍现状、存在问题及建议对策.doc
- 盗梦空间_英文台词剧本解析.doc
- 磁场传感器的应用及市场调研报告.doc.doc
- 碧云社区资料整理.doc.doc
- 百适可(草酸艾司西酞普兰)产品介绍.ppt
- 碧桂园与银行投资理财沙龙活动方案【精选资料】.doc
- 2025至2030中国水龙头净化系统市场销售规模及营销创新战略规划报告.docx
- 2025年医疗行业护理部护士长临床护理管理手册.docx
- 2025至2030中国乳制品包装行业产业运行态势及投资规划深度研究报告.docx
- 学生会办公室工作计划范文.docx
- 学生会办公室的工作总结开头.docx
- 《地理野外实践活动方法指导》课件_高中地理_必修第一册_中图中华地图版.pptx
- 2025至2030中国三聚氯氰行业市场发展分析及前景趋势与投资战略报告.docx
- 学生会办公室11月工作计划.docx
- 学会包容理解身边人,友好化解生活小矛盾.pptx
- 2025至2030中国数控重型立式车床行业竞争风险与发展规划动态报告.docx
最近下载
- 【TCP云运维】腾讯云运维高级工程师认证考试题库(汇总)..doc VIP
- 矿用电缆故障点定位方法的多维度解析与创新应用研究.docx
- 2026年上海市嘉定区中心医院医护人员招聘考试参考题库附答案解析.docx VIP
- 2026年中考语文备考之非连续性文本阅读备考训练:科技创新主题.docx VIP
- 2026年上海市嘉定区中心医院医护人员招聘笔试备考题库及答案解析.docx VIP
- 2026年上海市嘉定区中心医院医护人员招聘考试备考题库及答案解析.docx VIP
- 2026年上海市嘉定区中心医院医护人员招聘考试备考试题及答案解析.docx VIP
- 【TCP云运维】腾讯云运维高级工程师认证考试题库(汇总).docx VIP
- 无人机在野生动物保护区的监测应用.pptx VIP
- 红外相机在鼠类监测中的应用.ppt VIP
原创力文档

文档评论(0)