- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元统计分析因子分析PPT
第八章 因子分析;第一节 什么是因子分析及基本思想;例如考虑人的五个生理指标:
X1:收缩压,X2:舒张压,X3:心跳间隔,
X4:呼吸间隔,X5:舌下温度
从生理学的知识知道,这五个指标是受植物神经支配的,植物神经分为交感神经与副交感神经,因此至少有两个公共的因素对它们有影响。
如果用F1 、F2分别表示交感神经与副交感神经,称为公因子,那么可以设想X1、X2、X3、X4、X5是F1 、F2的线性函数,即
i=1,2,…,5;即
用矩阵表示
或 X=AF+ε;这里 是其它对 有影响的因子,通常是指公共因子以外的因子称为特殊因子。 只对 有影响。通常假定;简记为;这里
是原始变量,
是公共因子,
也就是说F对每个Xi都起作用,
ε称为特殊因子, εi只对 起作用。
A称为因子载荷矩阵,其中元素 称为因子载荷,
是原变量 在公因子 上的负荷。;由E(F)=0,E(ε)=0,知E(X)=0
假定X的每一个分量的方差都是1,Var(Xi)=1,
即Xi为标准化变量;(1) 因子载荷aij的统计意义;即 是原变量 与公共因子 的相关系数,即 依赖 的程度(比重),
因此用统计学的术语叫“权”,心理学家叫它“载荷”,表示第i个变量在第j个公共因子上的负荷。 ;(2) 变量共同度的统计意义
将下式两边求方差,即
记 称为变量共同度,是因子载荷矩阵A中第i行元素的平方和,是所有公共因子对 的方差贡献
每一个 表示相应 对 的方差贡献。 反映了特殊因子对 的方差贡献, 叫特殊因子方差。则;说明变量 的方差由两部分组成:第一部分 为变量共同度,它反映了全部公因子对变量 的总方差所作的贡献,第二部分 为特殊因子方差。
若 则说明变量 的几乎全部信息都被所选取的公因子说明了。
若 则说明 几乎全部信息都由特殊因子解释公因子对 起的作用很小。
由此可见, 反映了变量 对公因子F的依赖程度;(3)公因子 的方差贡献的统计意义
考虑指定的一个公因子 , 对各变量 的影响,由A
中第j列的元素平方和来???述。
令
j=1,2,…,p
称 为公因子 对X的贡献。表示公因子 对每一个
变量 所提供的方差贡献总和。
很明显, 的值越大,反映了 对X的影响越大,所以
是衡量公因子重要性的一个尺度,一个指标。;总结上述讨论,我们得到矩阵A中元素的统计意
义如下:
(1) 是原变量 与公因子 的相关系数
(2) = 是公因子F对 的方差贡献,也是
变量 对公因子F的依赖程度
(3) 是公因子 对X的方差贡献,
是衡量公因子重要性的一个指标。 ;
(1)每一个 是原变量 与公共因子 的相关系数
(2)每一行元素的平方和 = 是所有公因子 对 的方差总贡献
(3)每一列元素的平方和 是公因子
对 的方差总贡献
;第三节 因子载荷矩阵的估计方法;设随机向量 的协方差矩阵为ΣX
λ1≥λ2≥…≥λp0为ΣX的特征根,
e1, e2, …,ep 为对应的标准正交特征向量 ,
U=(e1, e2, …,ep), 由主成分分析中我们知道
所以;
ΣX
(1)
注意这时X=AF
又由于
ΣX=D(X)=D(AF)=AD(F)Aˊ=AAˊ (2)
比较(1)(2)可得A=( );实际当最后p-m个特征根较小时,略去最后p-m个公因子。这样损失比例小,(也即同主成分分析一样考虑累积贡献率达85%以上。)
这时可得因子载荷阵 ;步骤如下:
一、原始数据矩阵X标准化。
二、计算协方差矩阵即相关系数矩阵R的特征根
及对应的标准正交特征向量
文档评论(0)