第5章聚类分析课件知识课件.ppt

第5章 聚类分析 ;什么是聚类;;什么是聚类;什么情况下需要聚类;聚类分析无处不在;聚类分析无处不在;聚类的应用领域;;聚类分析原理介绍;有多少个簇?;聚类分析原理介绍;聚类分析原理介绍;聚类分析原理介绍;聚类分析原理介绍;聚类分析原理介绍;聚类分析原理介绍;聚类分析原理介绍;度量对象间的相似与差异;度量对象间的相似与差异;度量对象间的相似与差异;二元属性变量;二元属性变量的相依表;对称二元变量和非对称二元变量;对称二元变量和非对称二元变量;对称二元变量和非对称二元变量;例 二元变量之间的相异度;例 二元变量之间的相异度;名词性属性变量;余弦相似度; 在信息检索、文本文档聚类和生物学分类中,需要对包含了大量符号实体的复杂对象进行比较和聚类 为了测量复杂对象间的距离,通常期望放弃传统的度量距离计算,而引入非度量的相似度函数 如果d1 和 d2 是两个文档向量,则 cos( d1, d2 ) = (d1 ? d2) / ||d1|| ||d2|| , 其中 ? 表示向量的点积(内积),|| d ||表示向量的范数. 问题:余弦相似度的范围?取最大值时是否两个向量相等?;余弦相似度计算的例子;如何选择恰当的度量;主要聚类方法的分类;主要聚类方法的分类;层次方法创建给定数据对象的层次分解 根据使用的方法,层次的方法可以分类为凝聚的或分裂的方法 凝聚法:也

文档评论(0)

1亿VIP精品文档

相关文档