- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
R软件在因子分析中的应用.doc
R软件在因子分析中的应用
摘要:
本文主要叙述了R软件在多元统计分析中的因子分析中的应用。因子分析是一种常用的多元统计分析(即多指标的统计分析)方法,是一种化繁为简,将指标数尽可能压缩的降维(即空间压缩)技术,也是一种综合评价方法。本文通过举例,分析了主成分算法的原理,加上一些分析结果,体现了R软件自主灵活的特点,同时加深对因子分析思想的理解和掌握,并为解决实际问题奠定基础。
1、概述
因子分析的思想始于1904年查尔斯. 斯皮尔曼对学生考试成绩的研究。它是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多元统计分析方法。根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就是公共因子。这些因子能够反映原来众多的观测变量所代表的主要信息,并解释这些观测变量之间的相互依存关系。对于所研究的问题就可以试图用最少个数的不可测的公共因子的线性函数和特殊因子之和来描述原来观测的每一分量。
2、因子分析基本原理
设对于某个问题的研究涉及到p个指标,分别用X1,X2,X3…XP表示,这个指标构成的p维随机向量设为,对X进行线性变换,可以通过线性组合的方式形成新的综合变量,这里用C表示。新的综合变量和原来变量之间的关系可以用下面的公式表示:
C1=uX1+uX2+?+uXP
C2=uX1+uX2+?+uXP
…
CP=uX1+uX2+?+uXP
上式中的线性组合可以是任意的,由不同的线性变换得到的综合变量的统计特征也是不一样的。为了使综合变量可以较好的描述原变量的特征,应该要让
Ct=utX的方差尽可能的大,并且Ci之间相互独立。为此,上式要满足以下的约束:
(1)u+u+?u=1(i=1,2,3,…,p);
(2)Ci和Cj互不相关( (i≠j;i,j=1,2,3,…,p));
(3)C1是X1,X2,X3,…,Xp所有满足约束1)的线性组合中方差最大的,C2
是线性组合中方差第二大的,其他的依次类推。
以上三条约束确定X1,X2,X3,…,XP分别被称为原始变量的第一,第二,…,第p个因子。各因子对变量的总方差贡献的大小不同,在实际的研究过程中,一般挑选前面几个方差最大的因子(累积方差贡献率在80%到90%之间)来分析问题,从而达到降低问题复杂程度,抓住主要矛盾的目的。
3、因子分析过程
一般而言,用因子方法对问题进行分析时,主要包含以下的基本过程:
(1)为了消除不同变量在数量级和量纲上的差异,将收集的原始数据进行标准化;
(2)求标准化后数据的相关矩阵;
(3)求相关矩阵的特征值和特征向量;
(4)根据特征值计算方差贡献率与累积方差贡献率,根据前几个主成分累积方差贡献率大于80%的原则,确定主成分为C1,C2,…,Cm;
(5)构建综合评价函数,其数学形式为:C=
(6)根据综合评价函数计算总得分,然后排序并评价。
R软件在因子分析中的应用
如何客观、准确地评价企业经营业绩的问题是多年来一直未能很好解决的问题,由于企业的经营业绩是多因素共同作用的结果,其众多的财务指标为分析上市公司经营业绩提供了丰富的信息,但同时也增加了问题分析的复杂性。由于各指标之间存在着一定的相关关系,因此可以用因子分析方法,将较少的综合指标分别综合存在于各单独指标中的信息,而综合指标之间彼此不相关,即各综合指标代表的信息不重叠,代表各类信息的综合指标即为因子。本例以上市公司中的水泥行业为例,研究因子分析方法在公司经营业绩评价分析中的应用。
为了说明R软件和是如何应用于因子分析中的,本文选取行业上市公司14家,分析其主营业务利润率(X1)、销售毛利润(X2)、速动比率(X3)、资产负债率(X4)、主营业务增长率(X5)、营业利润增长率(X6)。数据如下:
14家水泥上市公司经营业绩六项指标数据
公司 X1 X2 X3 X4 X5 X6 海螺股份 36.29 36.96 0.27 58.31 70.85 117.59 冀东水泥 33.8 34.75 0.67 59.77 15.49 16.35 福建水泥 34.51 35.44 0.38 61.61 23.91 -163.99 祁连山 33.31 34.3 1.17 45.8 12.18 39.46 华新水泥 25.08 26.12 0.64 69.35 22.38 -10.2 太行股份 30.45 31.13 1
您可能关注的文档
- (选修课)东方文学史-答案.docx
- 1-RSLinx-Classic-通信软件-安装步骤.docx
- 100条脑筋急转弯大全及答案[一]1.doc
- 2011版2333软件工程课后习题答案.doc
- 2012重庆市公需科目继续教育考试及答案-Microsoft-Office-Word-文档.docx
- 2013年软件工程期末试卷(自己整理的-很完整的).docx
- 2015-2016学年高中政 治(练习)第7课-第1框世界是普遍联系的.doc
- 2016.10超星学习通中国古代史-课后章节测验-答案.doc
- 2016年《行政事业单位内部控制规范(试行)》讲解--限时考试试题及答案.docx
- 2017年从爱因斯坦到霍金的宇宙-超星答案.docx
文档评论(0)