第章主成分分析.pptVIP

  • 42
  • 0
  • 约1.72万字
  • 约 78页
  • 2017-06-24 发布于四川
  • 举报
第八章 多元数据分析 1、主成分分析的概念 2、主成分分析方法 主成分分析的概念 多变量大样本为科学研究提供丰富的信息,但也在一定程度上增加了数据采集的工作量,更重要的是在大多数情况下,许多变量之间可能存在相关性而增加了问题分析的复杂性,同时对分析带来不便。 主成分分析的概念 如果分别分析每个指标,分析又可能是孤立的,而不是综合的。 盲目减少指标会损失很多信息,容易产生错误的结论。 因此需要找到一个合理的方法,减少分析指标的同时,尽量减少原指标包含信息的损失,对所收集的资料作全面的分析。 主成分分析的概念 由于各变量间存在一定的相关关系,因此有可能用较少的综合指标分别综合存在于各变量中的各类信息。主成分分析就是这样一种降维的方法。 主成分分析就是将多个实测变量转换为少数几个不相关的综合指标的多元统计分析方法 主成分分析的概念 综合指标之间彼此不相关,即各指标代表的信息不重叠。综合指标称为因子或主成分,一般有两种方法: 特征值1 累计贡献率0.8 例:成绩数据 100个学生的数学、物理、化学、语文、历史、英语的成绩如下表(部分)。 从本例可能提出的问题 能不能将6个变量用一两个综合变量来表示呢? 这一两个综合变量包含有多少原来的信息呢? 能不能利用找到的综合变量来对学生排序呢?这一类数据所涉及的问题可以推广到对企业,对学校进行分析、排序、判别和分类等问题。 本例中的

文档评论(0)

1亿VIP精品文档

相关文档