第四章 统计模式识别中的.ppt

第四章 统计模式识别中的

第四章 统计模式识别中的 聚类方法;4.1 相似性准则(相似性度量) 4.2 聚类准则函数 4.3 两种简单的聚类算法 4.4 系统聚类 4.5 分解聚类 4.6 动态聚类 4.7 最小张树聚类 ;如下图所示,表示具有相同的试验平均值和样本协方差矩阵的三个数据集 ;4.1 相似性准则(续) ;4.1 相似性准则(续) ;在聚类分析中,常用的聚类要素的数据处理方法有如下几种: ;d、还要注意模式样本测量值的选取,应该是有 效反映类别属性特征(各类属性的代表应均衡) ;(2)马氏(Mahalanobis)距离 定义:马氏距离的平方 其中, 为均值向量, 为协方差矩阵 (3)明氏(Minkowsky)距离 定义:明氏距离: , 它是若干距离函数的通式: 时,等于欧氏距离; 时,称为“街坊”(city block)距离 ;4.1 相似性准则(续) ;样本相似性度量是聚类分析的基础,针对具体问题,选择适当的相似性度量是保证聚类质量的重要问题。但有了相似性度量还不够,还必须有适当的聚类准则函数。聚类准则函数对聚类质量也有重大影响。 相似性度量 → 集合与集合的相似性。 相似性准则 → 分类效果好坏的评价准则。;4.2 聚类准则函数 ;;4.2 聚类准则函数(续) ;;3.

文档评论(0)

1亿VIP精品文档

相关文档