第10章主成分分析与因子分析 主成分分析 因子分析 学习目标 1.主成分分析的基本思想 2.主成分分析的软件实现和结果分析 3.因子分析的基本思想 4.因子分析的软件实现和结果分析 主成分分析 主成分分析的原理 多元统计分析处理的是多变量(多指标)问题。由于变量较多,增加了分析问题的复杂性。但在实际问题中,变量之间可能存在一定的相关性,因此,多变量中可能存在信息的重叠。人们自然希望通过克服相关性、重叠性,用较少的变量来代替原来较多的变量,而这种代替可以反映原来多个变量的大部分信息,这实际上是一种“降维”的思想。 “主成分分析”、“因子分析”都可以用来对数据进行降维。 主成分分析的基本思想 主成分分析(Principal components analysis)是由Hotelling于1933年首先提出的。 由于多个变量之间往往存在着一定程度的相关性。人们自然希望通过线性组合的方式,从这些指标中尽可能快地提取信息。 当这些变量的第一个线性组合不能提取更多的信息时,再考虑用第二个线性组合继续这个提取的过程,……,直到提取足够多的信息为止。这就是主成分分析的思想。 主成分分析的基本思想 主成分分析适用于原有变量之间存在较高程度相关的情况。 在主成分分析适用的场合,一般可以用较少的主成分得到较多的信息量,从而得到一个更低维的向量。通过主成分既可以降低数据“维数”又保留了原数据的大部分
原创力文档

文档评论(0)