- 20
- 0
- 约 73页
- 2017-05-21 发布于河南
- 举报
* 若分类数k是已知的,求分类法b(n,k),使它在损失函数意义下达到最小,其求法如下: 首先从分两类开始,找出分点jk,使 于是得第k类 3、最优解的求法 * 然后,找出jk-1,使它满足 于是得第k-1类 * 再然后,找出jk-2,使它满足 于是得第k-2类 类推。一直可以得到所有类G1,G2,…Gk,这就是所求得最优解。 * 4、L[b(n,k)]的递推公式(证明见张润楚P 258) 以上的两个公式的含义是,如果要找到n个样品分为k个类的最优分割,应建立在将j-1(j=2,3,…,n)个样品分为k-1类的最优分割的基础上。 * 总结 1、选择变量 (1)和聚类分析的目的密切相关 (2)反映要分类变量的特征 (3)在不同研究对象上的值有明显的差异 (4)变量之间不能高度相关 2、计算相似性 相似性是聚类分析中的基本概念,他反映了研究对象之间的亲疏程度,聚类分析就是根据对象之间的相似性来分类的。有很多刻画相似性的测度 * 3、聚类 选定了聚类的变量,计算出样品或指标之间的相似程度后,构成了一个相似程度的矩阵。这时主要涉及两个问题: (1)选择聚类的方法 (2)确定形成的类数 *
原创力文档

文档评论(0)