- 1、本文档共31页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数理统计学进阶6
第5章 主成份与因子分析;; 如果系数uij满足 ;而且系数uij的确使yi、与yj (i≠j)相互无关,并使y1是x1,x2,…,xp的一切线性组合中方差最大者,y2是与y1不相关的x1,x2,…,xp的所有线性组合中方差最大者,……,yp是与y1,y2 ,…,yp-1都不相关的x1,x2,…,xp的所有线性组合中方差最大者,则称y1,y2,…,yp为原变量的第一,第二, …,第p主成份。;模型的求解;主成份的性质;主成份分析数据形式:;(3)解特征根 ∣R-λI∣=0,求相关系数矩阵R的特征根
(Eigenvalue) λi,且将它们从大到小排列为:λ1≥λ2≥…≥λp
(4)求矩阵R关于λi的满足正规条件的特征向量(Eigenvector):
Li =(li1,…,lip), i=1,…,p
则
即位所求的第i(i=1,…,p)主成份,其中:
当实测值较多时,相关矩阵的特征根地计算较复杂,故主成份的计算一般需要统软件来实施。; 确定主成份个数的方法:
(1)累积贡献率:当前k个主成份的累积贡献率达到某
一特定值(一般采用70%以上)时,则保留前k个主成
份;
(2)特征根:一般选取特征根λ≥1 的主成份。
? 几个基本概念:
(1)特征根(Eigenvalue):表示主成份影响力度大小的指
标,即引入该主成份后可以解释平均多少原始变量
的信息。如果特征根小于1,说明该主成份的解释
程度还不如直接引入一个原始变量的平均解释程度
大,因此在确定主成份个数时,常常选取特征根大
于1的主成份;;(2)主成份Zi的方差贡献率,计算公式为:
式中λi 表示主成份Zi 的方差在全部方差中的比重。
这个值越大,表明主成份Zi 综合原始变量信息的能力
越强。
?
(3)累积贡献率:前k个主成份的累积贡献率定义为:
表示前k个主成份累积提取了原始变量多少的信息。
;? 因子分析;1.因子分析的基本概念:
通过显在变量,由具体指标评测抽象因子的分析方法,最早是由心理学家 Chales Spearman 于1940年提出的。其基本目的是用少数几个因子去描述多个变量之间的关系,被描述的变量一般都是能实际观察到的随机变量,而那些因子是不可观察的潜在变量。基本思想是根据相关性的大小把变量分组,使得同组内的变量相关性较高,而不同组内的变量相关性较低。每组变量代表一个基本结构,这些基本结构成为一个公共因子。对于所研究的问题就可以试图用最少数的不可观察的公共因子的线性函数与特殊因子之和来描述原来观察的每一个分量。; 因子分析可分为两类:(1)探索性因子分析(Exploratory factor analysis);(2)确定性因子分析(confirmatory factor analysis)。探索性因子分析通常就称为因子分析,主要应用在数据分析的初期阶段,其主要目的是探讨可观察变量的特征、性质及内部的关联性,并揭示有哪些潜在因子尽可能多地表达原可观察变量的信息。确定性因子分析是在探索性因子分析的基础上进行的。当已经找到可测变量可能被哪些潜在因子影响,而进一步明确每一个潜在因子对可测变量的影响程度,以及这些潜在因子之间的关联程度时,则可进行确定性因子分析。该分析不要求所找出的这些潜在因子之间相互独立,其目的是明确潜在因子之间的关联性,它是将多个指标之间的关联性研究简化为对较少几个潜在因子之间的关联性研究,其分析结果需进行统计检验,确定性因子分析是结构方程模型分析的关键一步。;2.因子分析的原理和方法:
基本出发点是用较少的相互独立的因子变量代替原来变量的大部分信息,可以用以下的数学模型来表示:
X1 = a11F1 + a12F2 +…+ a1mFm
X2 = a21F1 + a22F2 +…+ a2mFm
…
Xp = ap1F1 + ap2F2 +…+ apmFm
?
式中,x1 , x2…, xp 为p个原有变量,是均值为0、标准差为1的标准化变量,F1,F2,…,Fm 为m个因子变量,m小于p,表示成矩阵形式为:
X = AF + aε
式中,F为公共因子,可以理解为高维空间中相互垂直的m个坐标轴;A为因子载荷矩阵,是第i个原有变量在第j个因子变量上的负荷。;3.因子分析的几个概念:
您可能关注的文档
- 省课题阶段性总结.doc
- 人教版2013年小学六年级语文毕业测试卷 2.doc
- examcoo 2-设计测试用例_2.pptx
- 评标专家应遵守的纪律-评标的基本程序.ppt
- 百合镇2017年春期教学工作会.ppt
- 第二章 招聘与配置(二级).ppt
- 第十四章 医学科研课题的申报与实施.ppt
- 五、式与方程.ppt
- 高中生物课件:2.3动物的克隆(浙科版选修三).ppt
- 第2章_工程项目的前期策划(授课).ppt
- 崇左市公安局警务辅助人员招聘126人笔试备考题库附答案详解.docx
- 山东临沂市教育科学研究院选聘部分教研员6人笔试备考题库附答案详解.docx
- 工业和信息化部所属事业单位2025年度公开招聘笔试高频难、易错点备考题库及答案详解1套.docx
- 山东省立医院菏泽医院(菏泽市立医院)招聘备案制工作人员12人笔试高频难、易错点备考题库含答案详解.docx
- 山东临沂市教育科学研究院选聘部分教研员6人笔试高频难、易错点备考题库附答案详解.docx
- 山西晋城市人力资源和社会保障局党组引进高层次人才方案笔试高频难、易错点备考题库及参考答案详解一套.docx
- 工业和信息化部所属事业单位2025年度公开招聘笔试备考题库附答案详解.docx
- 巴彦淖尔市退役军人事务局所属事业单位竞争性比选工作人员笔试高频难、易错点备考题库及答案详解一套.docx
- 山东青岛市市南区选聘2025届优秀师范类毕业生60人笔试高频难、易错点备考题库及答案详解1套.docx
- 山东烟台财金集团招聘笔试题库含答案详解(综合卷).docx
文档评论(0)