- 10
- 0
- 约8.98千字
- 约 24页
- 2018-04-27 发布于河南
- 举报
聚类分析算法
第二章 聚 类 分 析
2·4 聚类的算法
2.4.1 聚类的技术方案
简单聚类
根据相似性阈值和最小距离原则聚类
(xi∈(={ x1,x2,…,xn} = (1((2(…((c;
if D(xi,mj)≤T, mj=(1/nj)(xi(j),xi(j) ∈(j,nj是(j中的样本个数,T是给定的阀值。
Then xi∈(i
类心一旦确定将不会改变。
谱系或层次聚类
按最小距离原则不断进行两类合并
类心不断地修正,但模式类别一旦指定后就不再改变。
依据准则函数动态聚类
影响聚类结果的主要因数:类心、类别个数、模式输入顺序。
所谓动态聚类,是指上述因数在聚类过程中是可变的。
规定一些分类的目标参数,定义一个能刻划聚类过程或结果优劣的准则函数,聚类过程就是使准则函数取极值的优化过程。这类方法有—均值法、ISODATA法、近邻函数法以及运用图论理论的最小张树法。
2.4.2 简单聚类方法
㈠ 根据相似性阈值和最小距离原则的简单聚类方法
⒈ 条件及约定
设待分类的模式为,选定类内距离门限。
⒉ 算法思想
计算模式特征矢量到聚类中心的距离并和门限比较而决定归属该类或作为新的一类中心。通常选择欧氏距离。
⒊ 算法原理步骤
⑴ 取任意的一个模式特征矢量作为第一个聚类中心。例如,令第一类的中心。
⑵ 计算下一个模式特征矢量到的距离。若,则建立新的一类,其中心;
原创力文档

文档评论(0)