- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验二 主成分分析---基于SPSS软件
一、实验目的及要求
掌握利用SPSS软件进行主成分分析的基本操作方法,试着理解SPSS软件给出的分析结果,并通过主成分分析去认识和理解因子分析的思想及过程。
二、实验内容
利用SPSS软件进行主成分分析,了解SPSS进行主成分析的步骤。
三、实验原理
主成分分析(Principal Components Analysis,PCA)也称为主分量分析,是一种通过降维来简化数据结构的方法;主成分分析因子分析中的一种方法,掌握了主成分析也就基本掌握了因子分析,因子分析的SPSS操作过程与主成分析类似,以下简单对因子分析的原理及步骤进行介绍。
我们在对某种现象进行描述时,总是要从不同的方面来说明,才能够对所描述对象有一个比较完整认识,而每一个方面往往就是一个变量,这样就会涉及到很多变量,给问题的分析增加难度。另一方面,这些变量之间往往又存在一定程度的联系,有的甚至是非常密切的联系,这就使我们用来分析的数据所包含的信息在一定程度上有所重叠。因子分析的目的就是使数据简化,即用较少的几个因子去表示具有相互关系的原始变量。
因子分析基本思想是从观测到的个变量的相关性入手,将相关性较高的变量归为一类,认为这些相关性紧密的变量背后会有起主导作用的内在原因,或者说有某个内在原因使得这些变量的关系紧密。如果共找出()个这样的内在原因,我们说这个变量有个公共因子。这样每个观察变量都可以写成个互不相关的公共因子的线性组合的形式,即因子分析的数学模式。
其中为公因子,可理解为原始变量共同具有的公共因素,或者说潜在变量,每个公因子至少要对两个原始变量起作用,否则将列入特殊因子。为特殊因子,他们都是不可观测的随机变量,每个特殊因子只对对应的一个原始变量有作用。用矩阵表示为:。
因子分析的基本步骤:
1.确定待研究的问题。首先要明确这次研究的目的,在相关理论的指导下,结合以往研究结果,再根据研究者自己的判断,确定研究中应该包括哪些变量。在选择变量时应注意所选变量必须是定距或定比变量;而样本量则应保持在变量个数的4~5倍以上。
2.建立相关系数矩阵,检查变量之间的相关性。因子分析的目的就是用潜在变量来解释具有相关关系的原始变量。所以变量之间必须具有较强的相关关系,才能适用于因子分析。
3.选择提取因子的方法。提取因子的方法有主成分法、主因子法、最大似然法、最小二乘法、最小残差法等等,而一般常用的是主成分法和主因子法。
4.确定因子的个数。常用的确定因子个数的方法有以下三种:1)根据研究者的设计方案或有关经验或知识事先确定;2)变量共同度,即原始变量对公因子依赖的程度,用因子载荷矩阵中第行元素的平方和表示,则有:。反映了公因子对的影响,可以看成是公因子对的方差贡献,即全部因子反映原始变量信息的百分比。越接近于1,说明原始信息保留的越多。根据对原始信息保留量的大小来确定因子个数。3)因子的累计方差贡献率。公因子对向量的贡献,用因子载荷矩阵中第列元素的平方和表示,则有: 。反映了公因子对各原始变量所提供的方差贡献的总和,是衡量公因子相对重要性的指标。一般要求所提取的公因子的累计方差贡献率应在60%以上。
5.因子旋转。得到初始因子载荷矩阵后,虽然它能反映因子与原始变量之间的关系,但是由于因子与很多变量都有关系,不便于对因子进行解释,这时就需要将因子载荷矩阵进行旋转。因子旋转的方法有正交旋转和斜交旋转两类,一般用正交旋转比较多,即在因子载荷矩阵后乘以一个正交矩阵。正交旋转不会影响每个变量的共同度,也不会影响所有公因子的累计方差贡献率,但是每个因子的方差贡献率会改变,最终达到某些变量在某个因子上的载荷较高,而在其它因子上的载荷却很低的目的,便于对每个因子的含义进行解释。最常用的正交旋转法是“方差最大正交旋转”。斜交旋转用于因子之间有相关关系的情况。
6.解释因子和命名。通过因子旋转后,因子对哪些原始变量有显著的负荷就比较清楚了,这时可以根据这些变量所隐含的意义来对因子进行解释和命名。
四、实验案例
公司老板在对应聘者进行面试时,从15个方面进行了打分,这15个方面分别是:x1—申请书的形式;x2—外貌;x3—专业能力;x4—讨人喜欢;x5—自信心;x6—精明;x7—诚实;x8—推销能力;x9—经验;x10—积极性;x11—抱负;x12— 理解能力;x13—潜力;x14—交际能力;x15—适应性。下面是48名应聘者的得分情况。试对变量进行因子分析,并对因子给出合理的解释。
应征者 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 1 6 7 2 5 8 7 8 8 3 8 9 7 5 7 10 2 9 10 5 8 10 9 9 10 5 9 9 8 8 8 10 3
文档评论(0)