- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
本章内容;10.1 因子分析概述;因子分析的特点
1、因子个数远远少于原有变量的个数;
2、因子能够反应原有变量的绝大部分信息;
3、因子之间不存在线性关系;
4、因子具有命名解释性。;10.1.2因子分析的数学模型和相关概念
数学模型
假设原有变量有p个,分别用 表示,且每个变量的均值是0,标准差是1,现将每个原有变量用k(kp)个因子 的线性组合来表示,即:; 在这个数学模型中,F称为公共因子,因为它出现在每个变量的线性表达式中,简称因子。因子可理解为高维空间中互相垂直的k个坐标轴;A称为因子载荷矩阵, 称为因子载荷,是第i个原始变量在第j个因子上的负荷; 称为特殊因子,表示原始变量不能被因子解释的部分。其均值为0,相当于多元线性回归模型中的残差。
因子分析的几个相关概念
1、因子载荷
在因子不相关的前提下,因子载荷是第i个变量与第j个因子的相关系数。因子载荷越大说明因子与变量的相关性越强,所以因子载荷说明了因子对变量的重要作用和程度。
; 2、变量共同度
变量共同度也称为公共方差。第i个变量的共同度定义为因子载荷矩阵中第i行元素的平方和,即:
变量共同度是全部因子对变量xi方差解释说明的比例,体现了
因子全体对变量xi的解释贡献程度,越接近于1,说明因子全
体解释说明变量xi的较大部分,变量共同度刻画了因子全体对
变量xi信息解释的程度,是评价变量信息丢失程度的重要指标;;10.2 因子分析的基本内容;10.2.2因子分析的前提条件
1、计算相关系数并进行统计检验
如果相关系数矩阵中的大部分相关系数小于0.3,那么这些变量不适合进行因子分析。
2、计算反映象相关矩阵(MSA越接近1,相关性越强)
除主对角元素外,其他大多数元素的绝对值均较小,对角线上元素越接近1,变量相关性越强。
; 3、Bartlett’s球度检验
以原有变量的相关系数矩阵为出发点,假设相关系数为单位矩阵,如果该检验对应的P值小于给定的显著性水平a,则应拒绝原假设,认为原有变量适合进行因子分析。
4、KMO检验
该统计???取值在0-1之间,越接近于1说明变量间的相关性越强,原有变量适合做因子分析。0.9以上表示非常合适;0.8-0.9表示合适;0.7-0.8表示一般;0.6-0.7表示尚可;0.5-0.6表示不太合适;0.5以下表示极不合适。
;10.2.3因子提取和因子载荷矩阵的求解
因子载荷矩阵的求解一般采用主成分法。主成分分析法通过坐标变换的手段,将原有的p个变量标准化后进行线性组合,转换成另一组不相关的变量y,即:;式中的系数按以下原则进行求解:
(1)
(2)
根据以上原则确定的变量依次为原始变量的第1、第2…第p个主成分。其中第一个主成分在总方差中所占比例最大,其余主成分在总方差中所占比例依次递减,即主成分综合原始变量的能力依次减弱。在主成份的实际应用中,一般只选取前面几个主成分即可,这样既减少了变量的数目,又能够用较少的主成分反映原始变量的绝大部分信息。; 可见,主成分分析关键的步骤是如何求出上述方程中的系数。通过方程的推导可以发现,每个方程中的系数向量是原始变量相关系数矩阵的特征值对应的特征向量。具体求解步骤如下:
(1)将原有变量进行标准化处理;
(2)计算变量的相关系数矩阵;
(3)求相关系数矩阵的的特征根 及对应的特征向量
; 因子分析利用主成分分析得到的p个特征根和对应的特征向量,在此基础上计算因子载荷矩阵:
由于因子分析的目的是减少变量个数,因此在计算因子载荷矩阵时,一般不选取所有特征值,而只选取前k个特征值和特征向量,得到下面包含k个因子的因子载荷矩阵:
;因子个数的确定方法:
(1)根据特征根确定因子数:一般选取大于1的特征根,还可规定特征根数与特征根值的碎石图并通过观察碎石图确定因子数;
(2)根据因子的累计方差贡献率确定因子数:通常选取累计方差贡献率大于85%的特征根个数为因子个数。
;第16页/共41页;例: 成绩数据(student.sav);从本例可能提出的问题;例中的的数据点是六维的;也就是说,每个观测值是6维空间中的一个点。我们希望把6维空间用低维空间表示。
先假定只有二维,即只有两个变量,它们由横坐标和纵坐标所代表;因此每个观测值都有相应于这两个坐标轴的两个坐标值;如果这些数据形成一个椭
文档评论(0)