10 主成分分析与因子.ppt

10 主成分分析与因子

主成分分析与因子分析 主成分的概念由Karl Pearson在1901年提出 考察多个变量间相关性一种多元统计方法 研究如何通过少数几个主分量来解释多个变量间的内部结构。即从原始变量中导出少数几个主分量,使它们尽可能多地保留原始变量的信息,且彼此间互不相关 主成分分析的目的:数据的压缩;数据的解释 它常被用来寻找判断事物或现象的综合指标,并对综合指标所包含的信息进行适当的解释 什么是主成分分析? (Principal Component Analysis) 对于存在线性相关的两个自变量,直接进行分析可能由于多重共线性而无法得出正确结论 如何对这两个变量所携带的信息(在统计上信息往往是指数据的变异)进行浓缩处理? 分别用横轴和纵轴表示两个变量,每个观测值就是二维坐标系中的一个点,所有的数据点大致散布成一个椭圆形,那么这个椭圆有一个长轴和一个短轴,我们称之为主轴,主轴之间是相互垂直的 主成分分析的基本思想是什么? (以两个变量为例) 显然,短轴方向上,数据点之间的差异较小;长轴方向上,数据变化则较大。如果原坐标系中的横轴和纵轴能够分别与椭圆的长短轴平行,那么相对来说,长轴所代表的变量就描述了数据的主要变化,短轴所代表的变量则描述了数据的次要变化 主成分分析的基本思想就是把原始数据构成的椭圆的主轴找出来,再用代表绝大部分信息的那个轴(也就是长轴)作为代替原始变量的新变量。多维变量降维过

文档评论(0)

1亿VIP精品文档

相关文档