- 4
- 0
- 约5.56千字
- 约 31页
- 2017-11-06 发布于江苏
- 举报
主成分及因子分析方法
主成分分析与因子分析 主成分分析 主成分分析 主成分分析 主成分分析 主成分分析 主成分的性质 因子分析 因子分析 多元统计方法之二 1、基本思想 主要目的是希望用较少的变量去解释原来资料中的大部分变量。利用降维的思想,在损失很少信息的前提下把多指标转化为少数几个综合指标的多元统计方法。每个主成分都是原始变量的线性组合,且各个主成分互不相关。 例如:在综合评价全国独立核算的工业企业经济效益中,涉及到9项指标。经主成分计算,只选择了2个主成分作为综合评价指标。代表原信息量的91.6%。 主成分的几何意义 x1,x2 压缩为 y1,丢弃信息y2 信息量的大小定义为D(y1) x1 x2 x1 x2 y1 y2 数据结构 假定 是一个p维向量,服从正态分布。 由于指标Xi的量纲不同,导致指标数量级上有很大差异,因此需要标准化。 基本原理 欲确定随机变量x1,x2,…,xp的线性变换,使得各主成分变异(方差)最大,且信息不重叠。 线性变换: 基本原理 不防设: 确定cij的步骤如下: 1)假设已经确定了η1; 2) 欲确定η2,满足: (正交) 计算步骤: 1)计算样本相关系数矩阵R的特征根和特征向量 特征值 特征向量 2)各主成分 3)计算累计贡献率(mp) 4)如果 则选择m个主成分。 定义:第k个主成分Yk与原始变量Xi的相关
原创力文档

文档评论(0)