数据仓库原理、的设计与应用第5章.pptVIP

  • 31
  • 0
  • 约5.19千字
  • 约 35页
  • 2017-08-31 发布于安徽
  • 举报
第5章 传统数据挖掘技术  5.1传统的统计分析类数据挖掘技术 5.2统计分析类工具 5.3统计分析类工具的应用 5.4统计分析类工具应用的问题 练习 5.1 传统的统计分析类数据挖掘技术 5.1.1 统计与统计类数据挖掘技术 1.统计与数据挖掘 统计推断分析 2.统计类数据挖掘技术 5.1 传统的统计分析类数据挖掘技术 5.1.2 数据的聚集与度量技术 常用的聚集函数,例如,count()、sum()、avg()、max()、min()等 数据中心趋势度量,可以采用算术平均值 加权算术平均值。 5.1.3 柱状图数据挖掘技术 5.1.3 柱状图数据挖掘技术 5.1.4 线性回归数据挖掘技术 5.1.5 非线性回归数据挖掘技术 5.1.6 聚类数据挖掘技术 5.1.6 聚类数据挖掘技术 2.分层聚类 BIRCH算法主要分两个阶段进行: 阶段一:扫描数据库,建立一个初始的CF树,看作一个数据的多层压缩,试图保留数据内在的聚类结构。当一个对象被插入到最近的叶节点(子聚类)中时,如果在插入对象后,存储在叶节点中子聚类的直径大于阀值,那么该叶节点被分裂,也可能有其他节点被分裂。新对象插入后,关于该对象的信息向根节点传递。通过修改阀值,CF树的大小可以改变。 阶段二:采用某个聚类算法对CF树的叶节点进行聚类。 BIRCH

文档评论(0)

1亿VIP精品文档

相关文档