多元统计聚类判别重点.pptVIP

  • 6
  • 0
  • 约小于1千字
  • 约 22页
  • 2016-12-18 发布于湖北
  • 举报
快速聚类与判别分析 聚类分析、判别分析 根据2013年不同地区6项经济指标数据采用快速聚类法分为四类不同的地区。 分为高消费地区、经济发达地区、中等发达地区、不发达地区 数据标准化处理 首先对原始数据进行标准化,避免因数据值差异过大对分类结果产生影响。(利用spss软件进行标准化) 主要描述统计量 经过标准化的数据结果: 2.在快速聚类中采用经过标准化的数据,本题将数据分成4类,该表列出了每一类的初始聚类聚核,是由SPSS自动生成,实际是所有数据中一项数据。其选择原则是聚核电距离其他点尽可能远。 3.该表是每次迭代过程中类别的聚核的变化,随着迭代次数的增加,类别聚核点的变化越来越小。本题采用2次迭代结果达到收敛。(spss默认设置了最多进行10次迭代过程) 4.该表是分成4类最终的聚类聚核点,表示各个类别在各个变量上的平均值。(快速聚类中是采用标准化后的值,所以平均值也是标准化后的平均值) 5.该表是利用方差分析判断所分类别是否合理。从表中可以明显看到分类后各个变量在不同的类别之间差异都是显著的,其所对应个P值均为0.000,接近于0,高度显著。所以对于将各国家和地区分成4类是合理的。 7.对数据的最后的分类结果 将以上结果整理成表格 该表是样本代入相应列的贝叶斯判别函数系数。 将各样本的值代入函数,得到F1、F2、F3、F4,然后比较

文档评论(0)

1亿VIP精品文档

相关文档