数据仓库课件1.pptVIP

  • 13
  • 0
  • 约7.75千字
  • 约 51页
  • 2017-05-22 发布于河南
  • 举报
数据仓库课件1

第5章 传统数据挖掘技术  5.1传统的统计分析类数据挖掘技术 5.2统计分析类工具 5.3统计分析类工具的应用 5.4统计分析类工具应用的问题 练习 5.1 传统的统计分析类数据挖掘技术 5.1 传统的统计分析类数据挖掘技术 5.1.3 柱状图数据挖掘技术 5.1.3 柱状图数据挖掘技术 5.1.4 线性回归数据挖掘技术 5.1.5 非线性回归数据挖掘技术 5.1.6 聚类数据挖掘技术 1.聚类分析原理 2.分层聚类 CURE算法的主要步骤如下: ⑴从源数据集中抽取一个随机样本S。 ⑵将样本S划分为一组划分。 ⑶对每个划分进行局部的聚类。 ⑷通过随机抽样剔除孤立点。如果一个簇增长太慢,就删除该簇。 ⑸对局部的簇进行聚类。落在每个新形成的簇中的代表点根据用户定义的收缩因子收缩或向簇中心移动。这些点代表了簇的形状。 ⑹用相应的簇标签来标记数据。 3.划分聚类 4.密度聚类 4.密度聚类 DBSCAN算法首先需要用户给定聚类对象的半径ε-邻域和ε-邻域中最少要包含的对象数MitPts。然后算法检查某个对象ε-邻域中的对象数,如果对象数大于MitPts,该对象就是核心对象,就构建以该对象为核心的新簇。然后反复寻找从这些核心对象出发在ε-邻域内的对象,这个寻找过程可能会合并一些簇,直到没有新的对象可以添加到任何簇中为止。 4.密度聚类

文档评论(0)

1亿VIP精品文档

相关文档