如何构造聚类.ppt

如何构造聚类

第10章 聚类分析 Cluster Analysis 1 聚类分析问题 2 相似性度量 3 聚类的准则 4 聚类方法 1 聚类分析的基本问题 1)聚类问题 2)对象特征的描述 3)数据的预处理 1) 聚类问题 1) 聚类问题 1) 聚类问题 1) 聚类问题 1) 聚类问题 聚类分析要解决的问题 2)对象特征的描述 2)对象特征的描述 2)对象特征的描述 3)数据的预处理 3)数据的预处理 ① 总和标准化 3)数据的预处理 3)数据的预处理 2 相似性度量 1) 样本之间的相似性度量 2) 类之间的相似性度量 另一种叫相似系数,性质越接近的变量或样品,它们的相似系数越接近于1或一l,而彼此无关的变量或样品它们的相似系数则越接近于0,相似的为一类,不相似的为不同类。 1) 样本之间的相似性度量 明考夫斯基距离主要有以下两个缺点 ①明氏距离的值与各指标的量纲有关,而各指标计量单位的选择有一定的人为性和随意性,各变量计量单位的不同不仅使此距离的实际意义难以说清,而且,任何一个变量计量单位的改变都会使此距离的数值改变从而使该距离的数值依赖于各变量计量单位的选择。 ②明氏距离的定义没有考虑各个变量之间的相关性和重要性。实际上,明考夫斯基距离是把各个变量都同等看待,将两个样品在各个变量上的离差简单地进行了综合。 1) 样本

文档评论(0)

1亿VIP精品文档

相关文档