聚类算法精讲数据挖掘实战与Python编程指南.pptxVIP

  • 0
  • 0
  • 约5.87千字
  • 约 123页
  • 2026-05-15 发布于江苏
  • 举报

聚类算法精讲数据挖掘实战与Python编程指南.pptx

第四章聚类分析;聚类分析;聚类(簇):数据对象的集合

是指依据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,这么的一组数据对象的集合叫做簇,并且对每一种这么的簇进行描述的过程。

它的目标是使得属于同一种簇的样本之间应该彼此相似,而不同簇的样本应该足够不相似

聚类分析

将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程

聚类是一种无指导的学习:没有预定义的类编号;机器学习;模式识别

空间数据分析

在GIS系统中,对相似区域进行聚类,产生主题地图

检测空间聚类,并给出它们在空间数据挖掘中的解释

图像处理

商务应用中,协助市场分析人员发觉不同的顾客群,对目标顾客群体进行划分。

万维网

对WEB上的文档进行分类

对WEB日志的数据进行聚类,以发觉相似的顾客访问模式;聚类分析的目标就是形成多个数据簇,并且数据簇需要满足下面两个条件:

同一种簇内的数据尽可能相似(highintra-classsimilarity);

不同簇的数据尽可能不相似(lowinter-classsimilarity)。;西安邮电大学;西安邮电大学;西安邮电大学;对给定数据对象集合进行层次分解

自底向上(凝聚)

自顶向下(分裂)

缺点:

合并或分裂的环节

不能被撤消;西安邮电大学;基于距离的聚类方法的缺点:只能发觉球状的簇,难以发觉任意形状的簇。

基于密度的聚类:只要临近区域的

文档评论(0)

1亿VIP精品文档

相关文档