模式识别导论(六)讲述.ppt

第六章 聚类分析 §6-1 分类与聚类的区别 分类:用已知类别的样本训练集来设计分类器(监督学习) 聚类(集群):用事先不知样本的类别,而利用样本的先验知识来构造分类器(无监督学习) §6-2 系统聚类 系统聚类:先把每个样本作为一类,然后根据它们间的相似性和相邻性聚合。 相似性、相邻性一般用距离表示 (1)两类间的距离 1、最短距离:两类中相距最近的两样品间的距离。 6、 离差平方和: 设N个样品原分q类,则定义第i类的离差平方和为: 离差平方和增量:设样本已分成ωp,ωq两类,若把ωp,ωq合为ωr类,则定义离差平方: 3、求最小元素: 4、把ω1,ω3合并ω7=(1,3) ω4,ω6合并ω8=(4,6) 5、作距离矩阵D(1) 6、若合并的类数没有达到要求,转3。否则停止。 3、求最小元素: 4、ω8,ω5,ω2合并, ω9=(2,5,4,6) §6-2 分解聚类 分解聚类:把全部样本作为一类,然后根据相似性、相邻性分解。 目标函数 两类均值方差 分解聚类框图: 对分算法:略 例:已知21个样本,每个样本取二个特征,原始资料矩阵如下表: 2、分别计算当 划入 然后再把 划入 时对应的E值,

文档评论(0)

1亿VIP精品文档

相关文档