因子分析-课件.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
因子分析-课件

因子分析 孙彬 2013.1.24 因子分析的意义 在实际问题的分析过程中,人们往往希望尽可能多的搜集关于分析对象的数据信息,进而能够比较全面的、完整的把握和认识它。于是,对研究对象的描述就会有很多指标。但是效果如何呢?如果搜集的变量过多,虽然能够比较全面精确的描述事物,但在实际建模时这些变量会给统计分析带来计算量大和信息重叠的问题。而消减变量个数必然会导致信息丢失和信息不完整等问题的产生。 因子分析是解决上述问题的一种非常有效的方法。它以最少的信息丢失,将原始众多变量综合成较少的几个综合指标(因子),能够起到有效降维的目的。 因子分析可以在多变量系统中,把多个很难解释,而彼此有关的变量,转化成少数有概念化意义而彼此独立性大的因素,从而分析多个因素的关系。 因子分析的特点 1、因子个数远远少于原有变量的个数; 2、因子能够反应原有变量的绝大部分信息; 3、因子之间不存在线性关系; 4、因子具有命名解释性。 因子分析的数学模型和相关概念 数学模型 假设原有变量有p个,分别用 表示,且每个变量的均值是0,标准差是1,现将每个原有变量用k(kp)个因子 的线性组合来表示,即: 在这个数学模型中,F称为公共因子,因为它出现在每个变量的线性表达式中,简称因子。因子可理解为高维空间中互相垂直的k个坐标轴;A称为因子载荷矩阵, 称为因子载荷,是第i个原始变量在第j个因子上的负荷; 称为特殊因子,表示原始变量不能被因子解释的部分。其均值为0,相当于多元线性回归模型中的残差。 因子分析的几个相关概念 1、因子载荷 在因子不相关的前提下,因子载荷是第i个变量与第j个因子的相关系数。因子载荷越大说明因子与变量的相关性越强,所以因子载荷说明了因子对变量的重要作用和程度。 10.2.2因子分析的前提条件 1、计算相关系数并进行统计检验 如果相关系数矩阵中的大部分相关系数小于0.3,那么这些变量不适合进行因子分析。 2、 KMO检验 该统计量取值在0-1之间,越接近于1说明变量间的相关性越强,原有变量适合做因子分析。0.9以上表示非常合适;0.8-0.9表示合适;0.7-0.8表示一般;0.6-0.7表示尚可;0.5-0.6表示不太合适;0.5以下表示极不合适。 因子个数的确定方法: (1)根据特征根确定因子数:一般选取大于1的特征根,还可规定特征根数与特征根值的碎石图并通过观察碎石图确定因子数; (2)根据因子的累计方差贡献率确定因子数:通常选取累计方差贡献率大于85%的特征根个数为因子个数。 因子的命名 观察因子载荷矩阵,如果因子载荷的绝对值在第j列的多个行上都有较大的取值,则表明因子fj能够同时解释许多变量的信息,且对每个变量只能揭示较少部分信息,但不能代表任何一个原有变量。这种情况下,因子fj的含义是模糊不清的,为解决这个问题,可通过因子旋转的方式是一个变量值在尽可能少的因子上有比较高的载荷。因子旋转一般采用正交旋转使新生成的变量仍可保持不相关,正交旋转一般采用方差最大法(varimax)。然后再根据各因子对各原始变量的解释程度进行命名。 计算因子得分 在因子分析实际应用中,当因子确定以后,便可计算各因子在每个样本上的具体数值,这些数值称为因子得分,形成的变量称为因子变量。计算因子得分的途径是用原有变量描述因子,第j个因子在第i个样本上的值可表示为: 2.操作步骤: ⒈ 录入数据 定义变量“A1”、“A2”、“A3”、“A5”、“A6”、“A7”、“A8”、“A9”、“A10”,并按照表? 输入数据 操作步骤: ⒉ 因素分析 (1)选择“Analyze-Data Reduction-Factor…”命令 ,将变量a1-a10选入variable 操作步骤: (2)设置描述性统计量(“Descriptives…”按钮 ) 操作步骤: ① “Statistics”(统计量)对话框   A “Univariate descriptives”(单变量描述性统计量):显示每一题项的平均数、标准差。   B “Initial solution”(未转轴之统计量):显示因素分析未转轴前之共同性、特征值、变异数百分比及累积百分比。   ② “Correlation Matric”(相关矩阵)选项框   A “Coefficients”(系数):显示题项的相关矩阵   B “Significance levels”(显著水准):求出前述相关矩阵地显著水准。   C “Determinant”(行列式):求出前述相关矩阵地

文档评论(0)

dart003 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档