多元统计分析之因子分析课堂.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2. 因子提取 因子提取方法 因子分析中,析取因子的方法有许多种,在“抽 取”对话框中的“方法”下拉列表框中,可以选择 不同的分析方法。 ( 1 )主成分法:为默认选项,也是最常用的使用方 法之一。 31 2020/4/24 此方法将原有的 P 个相关变量 X i 作线性变换后转 成另一组不相关的变量 Y i , 即: y 1 =u 11 x 1 +u 21 x 2 + … +u p1 x p y 2 =u 12 x 1 +u 22 x 2 + … +u p2 x p …… y P =u 1P x 1 +u 2P x 2 + … +u pp x p 该方程组要求: u 1k 2 + u 2k 2 + u 3k 2 + … + u pk 2 =1 (k=1,2,3, … p) 32 2020/4/24 系数 u i j 依照两个原则来确定: y i 与 y j (i≠j,i,j=1,2,3, … p) 互不相关; y 1 是 x 1 ,x 2 ,x 3 , … ,x p 的一切线性组合(系数满足上 述方程组)中方差最大的; y 2 是与 y 1 不相关的 x 1 ,x 2 ,x 3 , … ,x p 的一切线性组合中方差次大的; y P 是与 y 1 , y 2 , y 3 , … y p 都不相 关的 x 1 ,x 2 ,x 3 , … ,x p 的一切线性组合中方差最小的;即 y 1 , y 2 , y 3 , y 4 , …… , y p 为原有变量 的第 1 、第 2 、第 3 和第 p 个主成分。 33 2020/4/24 通过选取前面几个方差最大的主成分,一方面 能够用较少变量反映原有变量的绝大部分信息(一 般方差的累计贡献率应大于 85% ),另一方面减少 了数据分析和处理的复杂程度。 ( 2 )未加权的最小平方法:该方法使实际的相关阵 和再生的相关阵之差的平方和达到最小。 34 2020/4/24 ( 3 )广义最小二乘法:该方法实际也是使实际的相 关阵和再生的相关阵之差的平方和达到最小。但是 对相关系数要进行加权,权重为其单值的倒数,这 样单值高的变量,其权重比单值低的变量的权重小。 35 2020/4/24 ( 4 )最大似然法。 该方法要求数据服从多变量正 态分布,此时它生成的参数估计值最接近观察到的 相关阵,在样本量较大时使用较好。 36 2020/4/24 ( 5 )主轴因子分解:该方法从原始变量的相关性出 发,使得变量间的相关程度能够尽可能地被公因子 解释。 该方法重在解释变量的相关性,确定内在结 构,而对于变量方差的解释不太重视。 37 2020/4/24 ( 6 ) α 因子分解法:此法将变量看成是从潜在变量 空间中抽取出的样本,在计算中尽量使得变量的 α 信度达到最大。 38 2020/4/24 ( 7 )映像因子分解:该方法把一个变量看作是其他 变量的多元回归,据此概念提取公因子。 39 2020/4/24 事实上,如果变量数和样本量都大,而且相关性 也高,则各种因子提取法的结果基本相同,区别仅 仅在于其分析思想不同。 主成分法是最常用的方法, 在多数情况下也是最佳的选择;如果样本量极大 (1500 以上 ) ,则极大似然法的结果稍为更精确些; 如果数据不好 ( 样本小,或变量少 ) ,α 因子法或映像 因子法可能更好;当对各种方法的原理不太清楚或 者适用条件不明的情况下,主成分法仍然是最好的 选择。 40 2020/4/24 因子个数的确定 根据特征值确定因子数:一般选取特征值大于 1 的公因子,因为如果特征值小于 1 ,说明该公因子的 解释力度太弱,还比不上直接引入一个原变量的平 均解释力度大。但是这一点在因子分析中并不是绝 对的,在实际应用中,可以将累计贡献率、特征值 大小与碎石图等综合起来考虑,必要时也可以保留 特征值小于 1 ,但是在专业上有明确含义的公因子。 41 2020/4/24 也可以根据因子的累计方差贡献率确定因子数: 通常选取累计方差贡献率大于 85% 的特征值个数为 因子个数。 另外,还可以通过直观观察碎石图的方式确定因子 的个数。 42 2020/4/24 3. 因子旋转 根据前述分析,因子分析得到的每个公共因子 都对原变量中的每一变量作出一定解释,而解释程 度的大小反映在因子载荷矩阵 A 的元素结构上。一 般我们可以得到每一列的因子载荷中有一些是比较 大的,而另一些比较小,就可以知道该列对应的因 子主要解释了哪些变量,以此确定该公共因子的主 要特征和内涵。 43 2020/4/24 但有时,因子载荷的大小差异不是非常明显, 此时公共因子的命名和解释就比较困难。这时可以 使用因子矩阵旋转对因子矩阵作变换,使得旋转之 后的载荷矩阵在每一列上元素的绝对值尽量地拉开 大小距

文档评论(0)

wangyueyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档