第七讲_因子分析.ppt

  1. 1、本文档共55页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七讲_因子分析

商学院 李丽明 因子分析最初于1904年由心理学家Spearman提出来的,用以分析学生考试的得分。1905年由W.C.Krumbein引进地质学。由于此法的特点,此后该法在经济学上得到广泛的应用。 基本思路:在影响某个目标的许多经济变量中,用某种方法构造出几个综合指标值,这几个综合指标完全能代表原有的经济变量对目标的影响,这几个指标值称为公共因子,然后由这几个公共因子与原目标的关系,构造出它们之间的线性函数关系,这样可由多个影响因素简化为几个影响因素(这些因素能够反映原变量提供的绝大部分信息,称为公共因子)。由此可算出每个样品得分再进行排序。这种方法广泛应用于:如若干个企业、行业或地区的综合效率评价的排序等等。 例如,企业经济效益的分析 在企业的经济效益的评价中,有许多衡量经济效益的指标,如固定资产利税率、资金利税率、销售收入利税率、固定资产产值率、资金利润率,这五个指标反映了企业盈利能力;流动资金周转天数、全员劳动生产率反映了企业的资金与人力利用状况;而万元产值能耗反映了企业的能耗状况。 如何评价不同的企业经济效益?因子分析就是一种较好的综合评价方法。 什么是因子分析? (factor analysis) 因子分析是通过对变量之间关系的研究,找出能综合原始变量的少数几个因子,使得少数因子能够反映原始变量的绝大部分信息,然后根据相关性的大小将原始变量分组,使得组内的变量之间相关性较高,而不同组的变量之间相关性较低。因此,因子分析属于多元统计中处理降维的一种统计方法,其目的就是要减少变量的个数,用少数因子代表多个原始变量。 因子分析分为两类,即R型因子分析(对变量作因子分析),Q型因子分析(对样品作因子分析)。 因子分析的数学模型 原始的p个变量表达为k个因子的线性组合变量 设p个原始变量为 ,要寻找的k个因子(kp)为 ,主成分和原始变量之间的关系表示为 因子分析的相关概念 因子载荷 在因子变量不相关的条件下,aij就是第i个原始变量与第j个因子变量的相关系数。aij绝对值越大,则Xi与Fi的关系越强 变量的共同度(Communality) 也称公共方差。Xi的变量共同度为因子载荷矩阵A中第i行元素的平方和 因子分析的相关概念 因子变量Fj的方差贡献 因子变量Fj的方差贡献为因子载荷矩阵A中第j列各元素的平方和 因子分析的步骤 (数据检验) 因子分析要求样本的个数要足够多 一般要求样本的个数至少是变量的5倍以上。同时,样本总数据量理论要求应该在100以上 用于因子分析的变量必须是相关的 如果原始变量都是独立的,意味着每个变量的作用都是不可替代的,则无法降维 检验方法 计算各变量之间的相关矩阵,观察各相关系数。若相关矩阵中的大部分相关系数小于0.3,则不适合作因子分析 使用Kaiser-Meyer-Olkin检验(简称KMO检验)和 Bartlett球度检验(Bartlett’s test of sphericity)来判断(SPSS将两种检验统称为“KMO and Bartlett’s test of sphericity”) 因子分析的步骤 (数据检验) Bartlett球度检验 以变量的相关系数矩阵为基础,假设相关系数矩阵是单位阵(对角线元素不为0,非对角线元素均为0)。如果相关矩阵是单位阵,则各变量是独立的,无法进行因子分析 KMO检验 用于检验变量间的偏相关性,KMO统计量的取值在0~1之间 如果统计量取值越接近1,变量间的偏相关性越强,因子分析的效果就越好 KMO统计量在0.7以上时,因子分析效果较好;KMO统计量在0.5以下时,因子分析效果很差 因子分析的步骤 (因子提取) Principal components(主成分法):多数情况下可以使用该方法(这也是SPSS的默认选项)。通过主成分分析的思想提取公因子,它假设变量是因子的线性组合 Unweight Least Square(不加权最小平方法):该方法使实际的相关矩阵和再生的相关矩阵之差的平方和达到最小 Generalized Least Square(加权最小平方法):用变量值进行加权,该方法也是使实际的相关矩阵和再生的相关矩阵之差的平方和达到最小 Maximum Likelihood(最大似然法):该方法不要求数据服从正态分布,在样本量较大时使用较好 Principal Axis Factoring(主轴因子法):该方法从原始变量的相关性出发,使得变量间的相关程度尽可能地被公因子解释 主成分分析的数学模型 数学上的处理是将原始的p个变量作线性组合,作为新的变量 设p个原始变量为

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档