讲聚类分析与判别分析;(优选)第讲聚类分析与判别分析;K-均值聚类法基本原理
;
K均值聚类法迭代终止条件
两次迭代计算的聚心之间距离的最大改变量小于初始聚心间最小距离的?倍
到达迭代次数的上限;
K均值聚类的优缺点
优点:占有内存少、计算量小、处理速度快,特别适合大样本的聚类分析
缺点:1、应用范围有限,要求用户指定分类数目;
2、只能对观测量聚类,而不能对变量聚类;
3、所使用的聚类变量必须都是连续性变量。;利用如下数据将以下城市按照空气指标分类
;执行【Analyze】/【Classify】/【K-meansCluster】命令,弹出如图所示对话框
;视观测量(或者变量)各自成为一类;
视观测量(或者变量)各自成为一类;
但当总体个数较多时,计算比较麻烦。
再将性质最接近的两类合并,直到所有模式聚成一类为止。
距离一般采用马氏距离;
Fisher判别对各类分布、方差都没有限制。
2、只能对观测量聚类,而不能对变量聚类;
Bayes判别法:在考虑先验概率的前提下,利用Bayes公式计算样品来自第i类的后验概率,使用错判损失最小的概念作判别准则,建立判别函数,将待判样品归入来自概率最大类。
再将性质最接近的两类合并,直到所有模式聚成一类为止。
Bayes判别法:在考虑先验概率的前提下,利用
原创力文档

文档评论(0)