机器学习 课件 第8章 聚类.pptx

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第8章聚类《机器学习》胡晓

8.1聚类基本理论??

8.1聚类基本理论?相似性测度在聚类算法,样本间相似度通常需要采用两个样本之间的“距离测度(DistanceMetric,DM)”进行衡量。?常见距离:欧氏距离、曼哈顿距离、闵可夫斯基距离、值差异值测度

8.1聚类基本理论类簇中心类簇中心,又称为簇质心,定义为簇内样本分布中心,如图8.1中每簇的中心点。然而,不同聚类算法定义各有差别,简单分为两种:K均值聚类簇中心?基于密度的类簇中心AlexRodriguez和AlessandroLaio在Science期刊文章中提出:类簇中心周围都是密度比其低的点,同时这些点距离该簇中心的距离相比于其他聚类中心最近。

8.1聚类基本理论聚类算法评价指标??纯度(Purity)将每个簇内频数最高的样本类别作为正确的类簇,聚类熵?

8.1聚类基本理论聚类算法评价指标同质性也叫均一性,一个类簇中仅有一个类别的样本,均一性最高同质性(Homogeneity)?相当于精确率,即被聚类的类簇中正确分类的样本数占该类簇中的样本数的比例,??

8.1聚类基本理论聚类算法评价指标完整性(Completeness)同类别的样本被归类到同一聚类簇中,则满足完整性。相当于召回率,即每个聚类中正确分类的样本数占该类别样本的数量,???

8.1聚类基本理论聚类算法评价指标兰德指数和调整兰德指数???

8.2K均值聚类???

8.3层次聚类层次聚类(hierarchicalclustering)是基于簇间的相似度的树形聚类算法。一般有两种划分策略:自底向上的凝聚策略和自顶向下的分拆策略。凝聚策略分拆策略初始时将每个样本点当做一个类簇,然后依据相似度准则合并相似度最大的类簇,直到达到终止条件。?

8.4密度聚类?密度聚类(Density-BasedSpatialClustering)是一种基于密度的聚类算法。

8.4密度聚类2、密度聚类基本过程

8.4密度聚类?8.4.2高斯混合聚类

谢谢!

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档