多变量数据的分析技术-I.pptVIP

  • 9
  • 0
  • 约1.06万字
  • 约 57页
  • 2016-11-08 发布于江苏
  • 举报
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 需要一组表示个体性质或特征的变量,称之为分类变量。 根据个体或样本之间联系的紧密程度进行分类。 一般来说分类变量的组合都是由研究者规定的,不是像其它多元分析方 法那样估计推导出来的。 聚类分析前所有个体或样品所属的类别是未知的,类别个数一般也是未 知的,分析的依据就是原始数据,没有任何事先的有关类别的信息可参考。 严格说来聚类分析并不是纯粹的统计技术,它不像其它多元分析法那样,需 要从样本去推断总体。 聚类分析一般都涉及不到有关统计量的分布,也不需要进行显著性检验。 聚类分析更像是一种建立假设的方法,而对假设的检验还需要借助其它 统计方法。 聚类分析的基本概念 Euclidean distance model Dimension 1 2 1 0 -1 -2 -3 Dimension 2 1.5 1.0 .5 0.0 -.5 -1.0 -1.5 -2.0 北京申办2008年奥运会 两岸关系 中国能否加入世贸组织 国营和集体企业改组、 依法治国 教育体制改革 打假 澳门回归 行业不正之风 土地承包政策不变 乱收费 农村脱贫致富 水灾后重建

文档评论(0)

1亿VIP精品文档

相关文档