以前讨论的分类方法都是在已知训练样本类别的基础上进行的。;;例如;生命科学
?
;聚类分析是人类的一种最基本的智能活动。是从个体到类别的一个概括,是进行抽象的基础。
单独处理各个模式(个体)有时是不可能的。人们倾向于将它们分类,每类有共同的属性。;2.聚类分析的应用;3.聚类的一般步骤;3)聚类的准则;5)聚类结果的验证;不同的特征,不同的相似性度量,不同的聚类准则,不同的算法,对同样的数据可能会得出完全不同的结果。;4.两种聚类问题及解决的方法:;各类样本混合起来,要把属于各类的样本分开。;第二种方法:(聚类,clustering);θ2;迭代的动态聚类算法
;8.2动态聚类算法的一般步骤;一般步骤如下;8.3C-均值聚类(K-均值聚类)算法
; J度量了用C个聚类中心m1,m2,…,mc来代表C个样本子集时,所产生的总的误差平方和。;C均值算法:
1、选择任意一个初始划分(把N个样本分为C类),或任意选择C个初始聚类中心,然后把N个样本按照距离分到最近的聚类中心去。
;C-均值聚类算法的两种类型;C-均值聚类算法的收敛性分析;设某样本yi从聚类?j移至聚类?k中,?j移出yi后的集合记为,?k移入yi后的集合记为。;两个
原创力文档

文档评论(0)