第八讲 主成分分析和因子分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第1页,共17页,星期日,2025年,2月5日变量压缩。主成分分析通过线性变换,在尽可能保留原始变量的信息的基础,降低维度,将原来的多个变量组合成相互独立的少数的、新的综合变量。变量解释。利用新变量进一步探讨变量内在联系和结构,利于简化和解释问题。因子分析和主成分分析方法,往往是更复杂的统计分析方法的基础。Factor1.sav、Factor2.sav第2页,共17页,星期日,2025年,2月5日二、主成分分析

1、基本原理统计信息实际上是指数据变异信息右图中,在椭圆的长轴方向数据变异明显大于短轴方向第3页,共17页,星期日,2025年,2月5日F1F2F1与F2不相关沿长、短轴方向设定新坐标系,长轴变量承载大部分变异信息,短轴变量承载少量变异信息.一个长轴新变量F1就可以代表原来两个变量的主要信息,从而起到降维作用在主成分分析中,提取出的每个新变量(主成分)都是原来多个变量的线性组合第4页,共17页,星期日,2025年,2月5日如由两个原始变量X1和X2,可提取两个主成分:F1=a11X1+a21X2F2=a12X1+a22X2依次类推:由N个原始变量可提取N个主成分,但如果将它们全部提取出来就失去了该方法简化数据的实际意义.一般情况下按贡献率由大到小,取累计贡献率达到85%的前2~3个主成分,其他的忽略不计。在进行主成分回归时,提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。第5页,共17页,星期日,2025年,2月5日利用主成分进行综合评价:当进行多指标的综合评价时,应用主成分方法将多指标中的信息集中为若干个主成分,然后加权求和,得到综合评价指数。利用主成分进行回归分析:通过对存在共线性的自变量进行主成分分析,从而在提取多数信息的同时解决共线性问题。2、应用第6页,共17页,星期日,2025年,2月5日与主成分分析相同,也是一种多变量化简、降维技术。在主成分分析时,要求提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。但在因子分析中,目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,每一类变量代表了一个“共同因子”,即一种内在结构。因子分析就是要寻找该结构。在实际应用中,有时两者不加区分三、因子分析

1、概述第7页,共17页,星期日,2025年,2月5日为了找出变量间内在结构,要求因子分析满足以下条件:样本量样本量与变量数的比例应在5:1以上总样本量最好大于100,而且原则上越大越好各变量间必须有相关性KMO统计量:在(0,1)之间,大于0.9最佳,0.9-0.7尚可,0.7-0.6很差,0.5以下放弃Bartlett’s球形检验:对变量间的独立性进行检验,若变量间相互独立(Sig.大于0.05),因子分析无效2、适用条件第8页,共17页,星期日,2025年,2月5日判断数据是否符合要求,是否有必要进行主成分/因子分析对原有变量标准化,以消除计量单位和数据基数的影响(SPSS会自动对原始变量标准化)根据标准化数据计算相关矩阵或协方差矩阵,及其特征根和特征向量进行分析,按一定标准确定提取的主成分/因子数3、步骤第9页,共17页,星期日,2025年,2月5日如果进行的是主成分分析,步骤到此结束如果进行的是因子分析,则考察因子的可解释性,并在必要时进行因子旋转,使因子载荷向0、1分化,以寻求最佳解释如有必要,计算因子得分等中间指标供进一步分析使用第10页,共17页,星期日,2025年,2月5日特征根(Eigenvalue):是因子影响力度的指标,其数值代表因子相当于原始变量平均解释力的多少。特征根大于1,表示引入的因子解释力度大于一个原始变量平均解释力度。因此往往将特征根大于1作为抽取因子的标准。方差贡献率:数值越大,表明该因子对原来变量信息的综合能力越强。累计贡献率4、输出统计量第11页,共17页,星期日,2025年,2月5日变量Xi的变量共同度:也称公因子方差比,是提取公因子后,各变量中信息被提取出的比例,或者说原变量的信息量(方差)由公因子决定的比例旋转前/后因子载荷:反映因子和各个变量间的密切程度的指标,实质是两者间的相关系数因子得分函数系数第12页,共17页,星期日,2025年,2月5日

文档评论(0)

xiaolan118 + 关注
实名认证
文档贡献者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档