林荣辉SPSS课件.pptVIP

  • 215
  • 0
  • 约7.81千字
  • 约 36页
  • 2017-11-02 发布于湖北
  • 举报
林荣辉SPSS课件

SPSS因子分析实例:图表给出了中国历年国民经济主要指标统计(1996-2003)。 (2)KMO和Bartlett球形度检验 KMO统计量为0.588,卡方统计量63.027,对应的显著性水平为p=0.0000.05,表示适合做因子分析。 (4)因子分析的总方差解释 接着Spss软件计算得到相关系数矩阵的特征值、方差贡献率及累计方差贡献率结果如下表所示,第一列是因子编号,以后三列组成一组,组中数据项的含义依次是特征根、方差贡献率和累计贡献率。 第一组数据项(第二至第四列)描述了初始因子解的情况。可以看到,第一个因子的特征根值为4.364,解释了原有6个变量总方差的72.739%。前2个因子的累计方差贡献率为92.479%,并且只有它们的取值大于1。说明前2个公因子基本包含了全部变量的主要信息,因此选前2个因子为主因子即可。 (5)碎石图 下图为因子分析的碎石图。横坐标为因子数目,纵坐标为特征根。可以看到,第一个因子的特征值很高,对解释原有变量的贡献最大;第2个以后的因子特征根都较小,取值都小于1,说明它们对解释原有变量的贡献很小,因此提取前2个因子是合适的。 (6)旋转前与旋转后的因子载荷矩阵 下表中显示了因子载荷矩阵,它是因子分析的核心内容。通过载荷系数大小可以分析不同公共因子所反映的主要指标的区别。从结果看,大部分因子解释性较好,但是仍有少部分指标解释能力较差,例如“原煤”指标在2个因子的载荷系数区别不大。因此接着采用因子旋转方法使得因子载荷系数向0或1两极分化,使大的载荷更大,小的载荷更小,这样结果更具可解释性。 可以看到,第一主因子在“国内生产总值”、“货物周转量”、“发电量”、“原油”四个指标上具有较大的载荷系数,说明第一主因子综合反映这几个方面的变动情况;第二主因子在“工业总产值”和“原煤”指标上系数较大,代表了这两个方面的变动趋势,此时,各个因子的含义更加突出。 (7)因子得分系数 根据表中内容可写出以下因子得分函数: 因子F1=-0.156X1+0.279X2+0.298X3-0.115X4+0.252X5+0.257X6; 因子F2= 0.623X1-0.076X2-0.128X3+0.573X4-0.007X5-0.026X6。 输入数据 SPSS因子分析 1.1 因子分析简介 因子分析是一种数据降维方法,它是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,如何使因子具有一定的命名解释性的多元统计分析方法.其核心是用较少的相互独立的因子反映原有变量的绝大部分信息。 因子分析可以对变量作因子分析(称为R型因子分析),也可以对样品作因子分析(称为Q型因子分析)。 因子分析有如下特点: (1)因子变量的数量远少于原有的指标变量的数量,对因子变量的分析能够减少分析中的计算工作量。 (2)因子变量不是对原有变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。 (3)因子变量之间不存在线性相关关系,对变量的分析比较方便。 (4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。 1.2 基本步骤: (1) 确认待分析的原变量是否适合作因子分析。因子分析的主要任务是将原有变量的信息重叠部分提取和综合成因子,进而最终实现减少变量个数的目的。故它要求原始变量之间应存在较强的相关关系。进行因子分析前,通常可以采取计算相关系数矩阵、巴特利特球度检验和KMO检验等方法来检验候选数据是否适合采用因子分析。 (2)构造因子变量。将原有变量综合成少数几个因子是因子分析的核心内容。它的关键是根据样本数据求解因子载荷阵。因子载荷阵的求解方法有基于主成分模型的主成分分析法、基于因子分析模型的主轴因子法、极大似然法等。 (3)利用旋转方法使因子变量更具有可解释性。将原有变量综合为少数几个因子后,如果因子的实际含义不清,则不利于后续分析。为解决这个问题,可通过因子旋转的方式使一个变量只在尽可能少的因子上有比较高的载荷,这样使提取出的因子具有更好的解释性。 (4)计算因子变量得分。实际中,当因子确定以后,便可计算各因子在每个样本上的具体数值,这些数值称为因子得分。于是,在以后的分析中就可以利用因子得分对样本进行分类或评价等研究,进而实现了降维和简化问题的目标。 1.3 因子分析名词解释 因子载荷的意义 在因子上的因子载荷实际上是原始变量和公共因子的相关系数。它们的大小反映了原始变量对公共因子的重要性。 变量共同度 它反映了公共因子对原始变量的影响程度。 公共因子的方差贡献 它衡量公共因子的重要性。 2

文档评论(0)

1亿VIP精品文档

相关文档