《回归分析与因子分析之比较》-毕业论文设计(学术).docVIP

《回归分析与因子分析之比较》-毕业论文设计(学术).doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
l 回归分析与因子分析之比较 数学与统计学院 【摘? 要】回归分析与因子分析是数理统计中常用的两种数据处理方法,本文对他们进行比较,分析了两种方法的区别与联系,各自的使用和适用范围,对教学质量的提高及在实际中对于有效选择此两种统计方法提供了依据。 【关键词】回归分析 因子分析 比较 问题提出 回归分析和因子分析都是研究因变量与因子间关系的一种数据处理方法,在模型上看,只是因子结构不一样,他们之间到底有什么内在联系,值得我们研究并加以利用。 问题分析 统计模型和类型 多元线性回归模型表示方法为 其解析表达式为: 多元模型的矩阵表达式为 一般地,设X=(x1, x2, …,xp)’为可观测的随机变量,且有 。在因子分析中,p维的变量向量x被赋予一个随机结构,x =α+Af+ε具体也可以写成以下形式: (1)其中α是p维向量,A是p×r参数矩阵,f是r维潜变量向量,称为公共因子(Common factors),而ε是p维的变量向量,称为特殊因子(Specific factors),满足下列假定: E(ε) =0,cov(ε) =Δ(对角矩阵)E(f) =0,cov (f,ε)=0,cov(f) =I (2) 它把每个变量分解为两部分,一部分是由这些变量内含的公共因子所构成的,即公共因子部分,另一部分是每个变量各自独有的因子,即所谓特殊因子部分。应当注意,因子模型不具有唯一性,设T是一个正交矩阵,由可知,因子模型x =α+Af+ε与模型x =α+(AT)(T′f)+ε等价。后者载荷矩阵为AT,新的公共因子T′f。正是由于因子模型的不唯一性,所以当原模型不适合专业解释时,则作一个正交变换T,把原模型改变为新模型,在新模型中再去寻找因子的专业解释,这就为因子旋转提供了理论的基础。 由两者的比较可知,两种模型都是用某几个因子来解释变量的,只是因子构成不一样,回归分析的因子之间可能存在相关关系,但是后者却是独立的。回归分析模型写成了原观测变量的线性组合,因子分析是描述原指标X协方差阵结构的一种模型,对原观测变量分解成公共因子和特殊因子两部分,当公共因子的个数m=原变量个数p时,就不能考虑特殊因子了,此时因子分析也对应于一种线性组合了,饿而且因子模型的系数矩阵表明了原变量和公共因子的相关程度。 目的和作用 回归分析是为了分析一个变量如何依赖其它变量而提出的一种统计分析方法,它的目的是要确定引起因变量变化的各个因素,多元线性回归是研究一个因变量(Y)和多个自变量(Xi)之间数量上相互依存的线性关系。利用回归分析可以进行因素分析、调整混杂因素和统计预测。 因子分析是用于研究个体测量指标的协方差(或相关)结构的探索性数据分析的多元技术。它找出若干可以解释可观测指标之间的变差或者联系的潜变量从而简化高维数据,并对相似指标进行分组及检测多重共线性,将高维数据在低维空间中图示以利于直观考察数据的分布情况及检测异常值。目标是通过减少变量的个数来了解数据的结构,在某种意义上可以取代原始数据,而且通过图示和多元推断技术更容易进行研究。它就是用少数几个有意义因子来描述多个指标或因素之间的联系,与此同时,又能保存住原有数据结构所提供的大部分信息,这样就可以找出潜在的特征。其目的为化简数据、浓缩信息、探讨内在结构,也就是说将分散在多个变量中的同类信息集中起来、提纯,从而便于分析、解释和利用。 同样是因变量和因子之间的关系,但是回归分析却能得出确切的数值关系,而且通常是定量的(不过对定性因素可以采用虚拟变数的处理方法)。但因子分析一般适用于定性的,不可观测的数据。不过,回归分析的关系不精简明了,而且确定的因子也是根据人为经验事先定好的,不如因子分析的全面,可能还得做逐步回归等才能剔除或增加变量。 适用原则 首先,回归分析和因子分析使用的数据不一样。回归分析同时需要因子和因变量的数据,数据结构为因变量和因子对应的顺序数据,即{}。而因子分析只需要在不同情况下对应的因变量的值,无需知道X的确切数值,只要根据调的数值就行了,也即这种方法可以揭示因子内部的关系。 其次,样本容量的要求也不同。回归分析最小样本容量 n ≥ k+1。对 ,有(X`X)-1存在?| X`X | 0 ? X`X 为k+1阶的满秩阵,R(AB) ≤ min(R(A),R(B)),R(X) ≥ k+1,因此,必须有n≥k+1。根据经验,有①n ≥ 30或者n ≥ 3(k+1)才能满足模型估计的基本要求。②n ≥ 3(k+1)时,t分布才稳定,检验才较为有效。根据Gromuch(1983)的观点,因子分析的样本量要求如下:一般原则是要求样本数目至少是变量个数的五倍,能有一比十的比例是较可被接受的,有些研究建议观察值个数为变量个数的二十倍;总样本最好应有100个或以上的观察

您可能关注的文档

文档评论(0)

沙卡娜 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档