- 8
- 0
- 约小于1千字
- 约 17页
- 2017-09-05 发布于江苏
- 举报
动态聚类法 思想:首先选择若干个样本作为聚类中心,再按照事先确定的聚类准则进行聚类.在聚类过程中,根据聚类准则对聚类中心反复修改,直到分类合理为止. K-均值聚类 又称为C-均值聚类,是根据函数准则进行分类的聚类算法, 使聚类准则函数最小化. 准则函数 K-均值算法的聚类准则 算法描述设共有N个模式样本,计算步骤如下: 算法讨论 K-均值算法受以下几个因素的影响 (1)指定聚类中心的个数是否符合模式的实际分布; (2)所选聚类中心的初始位置; (3)样本分布的几何性质; (4)样本的读入次序. 聚类结果的评价 常见的几个评价指标 (1)聚类中心之间的距离 同一类样本相聚比较密集,不同类样本相距较远.聚类中心之间的距离通常总大于各类样本的类内平均距离.类间距离太小,说明两类靠得太紧,有可能合并. (2)诸聚类域中的样本数目 如果样本的抽取比较合理,通常各类的样本数相差不大.因此聚类结果中,若某一类的样本数较其它类的样本数明显多得多,该类有可能是几类样本的集合. 综合考虑(1)、(2) (3) 诸聚类域内样本距离的标准差向量 聚类域内样本与聚类中心对应分量差的平方和的平均值叫方差.方差的算术平方根叫做标准差. 此外还可以用其它距离度量之分析模式样本的聚类性质.例如: 在一个聚类域内,距离聚类中心最远与最近的样本位置等. * * 试探 (k=2)
原创力文档

文档评论(0)