- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第8章聚类《机器学习》胡晓
8.1聚类基本理论??
8.1聚类基本理论?相似性测度在聚类算法,样本间相似度通常需要采用两个样本之间的“距离测度(DistanceMetric,DM)”进行衡量。?常见距离:欧氏距离、曼哈顿距离、闵可夫斯基距离、值差异值测度
8.1聚类基本理论类簇中心类簇中心,又称为簇质心,定义为簇内样本分布中心,如图8.1中每簇的中心点。然而,不同聚类算法定义各有差别,简单分为两种:K均值聚类簇中心?基于密度的类簇中心AlexRodriguez和AlessandroLaio在Science期刊文章中提出:类簇中心周围都是密度比其低的点,同时这些点距离该簇中心的距离相比于其他聚类中心最近。
8.1聚类基本理论聚类算法评价指标??纯度(Purity)将每个簇内频数最高的样本类别作为正确的类簇,聚类熵?
8.1聚类基本理论聚类算法评价指标同质性也叫均一性,一个类簇中仅有一个类别的样本,均一性最高同质性(Homogeneity)?相当于精确率,即被聚类的类簇中正确分类的样本数占该类簇中的样本数的比例,??
8.1聚类基本理论聚类算法评价指标完整性(Completeness)同类别的样本被归类到同一聚类簇中,则满足完整性。相当于召回率,即每个聚类中正确分类的样本数占该类别样本的数量,???
8.1聚类基本理论聚类算法评价指标兰德指数和调整兰德指数???
8.2K均值聚类???
8.3层次聚类层次聚类(hierarchicalclustering)是基于簇间的相似度的树形聚类算法。一般有两种划分策略:自底向上的凝聚策略和自顶向下的分拆策略。凝聚策略分拆策略初始时将每个样本点当做一个类簇,然后依据相似度准则合并相似度最大的类簇,直到达到终止条件。?
8.4密度聚类?密度聚类(Density-BasedSpatialClustering)是一种基于密度的聚类算法。
8.4密度聚类2、密度聚类基本过程
8.4密度聚类?8.4.2高斯混合聚类
谢谢!
您可能关注的文档
最近下载
- 2024海南屯昌县总工会社会化工会工作者招聘3人 (第1号)笔试备考试题及答案解析.docx VIP
- 三年级数学上册人教版53全优卷.pdf
- (高清版)B-T 16886.11-2021 医疗器械生物学评价 第11部分:全身毒性试验.pdf VIP
- 水电站电气一次设计.docx VIP
- ICU患者血糖的管理.ppt VIP
- 光伏+储能 收益率最高的装机、储能测算.xls VIP
- 黑龙江省哈尔滨市巴彦县第一中学2022-2023学年七年级上学期期中考试语文试题(含答案).docx VIP
- 创新文物改编游戏企划书.pptx VIP
- 海尼曼 Fountas & Pinnell 有声绘本-英语入门066 The New Roof.pdf VIP
- 2021.4助理全科基层基地教学管理1.pptx VIP
文档评论(0)