多元统计分析之因子分析课堂.pptVIP

下载本文档

16
0
约6.94千字
约 68页
2020-08-07 发布于天津
举报
版权申诉

多元统计分析之因子分析课堂.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

2. 因子提取因子提取方法因子分析中，析取因子的方法有许多种，在“抽取”对话框中的“方法”下拉列表框中，可以选择不同的分析方法。（ 1 ）主成分法：为默认选项，也是最常用的使用方法之一。 31 2020/4/24 此方法将原有的 P 个相关变量 X i 作线性变换后转成另一组不相关的变量 Y i ，即： y 1 =u 11 x 1 +u 21 x 2 + … +u p1 x p y 2 =u 12 x 1 +u 22 x 2 + … +u p2 x p …… y P =u 1P x 1 +u 2P x 2 + … +u pp x p 该方程组要求： u 1k 2 + u 2k 2 + u 3k 2 + … + u pk 2 =1 (k=1,2,3, … p) 32 2020/4/24 系数 u i j 依照两个原则来确定： y i 与 y j (i≠j,i,j=1,2,3, … p) 互不相关； y 1 是 x 1 ,x 2 ,x 3 , … ,x p 的一切线性组合（系数满足上述方程组）中方差最大的； y 2 是与 y 1 不相关的 x 1 ,x 2 ,x 3 , … ,x p 的一切线性组合中方差次大的； y P 是与 y 1 , y 2 , y 3 , … y p 都不相关的 x 1 ,x 2 ,x 3 , … ,x p 的一切线性组合中方差最小的；即 y 1 ， y 2 ， y 3 ， y 4 ， …… ， y p 为原有变量的第 1 、第 2 、第 3 和第 p 个主成分。 33 2020/4/24 通过选取前面几个方差最大的主成分，一方面能够用较少变量反映原有变量的绝大部分信息（一般方差的累计贡献率应大于 85% ），另一方面减少了数据分析和处理的复杂程度。（ 2 ）未加权的最小平方法：该方法使实际的相关阵和再生的相关阵之差的平方和达到最小。 34 2020/4/24 （ 3 ）广义最小二乘法：该方法实际也是使实际的相关阵和再生的相关阵之差的平方和达到最小。但是对相关系数要进行加权，权重为其单值的倒数，这样单值高的变量，其权重比单值低的变量的权重小。 35 2020/4/24 （ 4 ）最大似然法。该方法要求数据服从多变量正态分布，此时它生成的参数估计值最接近观察到的相关阵，在样本量较大时使用较好。 36 2020/4/24 （ 5 ）主轴因子分解：该方法从原始变量的相关性出发，使得变量间的相关程度能够尽可能地被公因子解释。该方法重在解释变量的相关性，确定内在结构，而对于变量方差的解释不太重视。 37 2020/4/24 （ 6 ） α 因子分解法：此法将变量看成是从潜在变量空间中抽取出的样本，在计算中尽量使得变量的 α 信度达到最大。 38 2020/4/24 （ 7 ）映像因子分解：该方法把一个变量看作是其他变量的多元回归，据此概念提取公因子。 39 2020/4/24 事实上，如果变量数和样本量都大，而且相关性也高，则各种因子提取法的结果基本相同，区别仅仅在于其分析思想不同。主成分法是最常用的方法，在多数情况下也是最佳的选择；如果样本量极大 (1500 以上 ) ，则极大似然法的结果稍为更精确些；如果数据不好 ( 样本小，或变量少 ) ，α 因子法或映像因子法可能更好；当对各种方法的原理不太清楚或者适用条件不明的情况下，主成分法仍然是最好的选择。 40 2020/4/24 因子个数的确定根据特征值确定因子数：一般选取特征值大于 1 的公因子，因为如果特征值小于 1 ，说明该公因子的解释力度太弱，还比不上直接引入一个原变量的平均解释力度大。但是这一点在因子分析中并不是绝对的，在实际应用中，可以将累计贡献率、特征值大小与碎石图等综合起来考虑，必要时也可以保留特征值小于 1 ，但是在专业上有明确含义的公因子。 41 2020/4/24 也可以根据因子的累计方差贡献率确定因子数：通常选取累计方差贡献率大于 85% 的特征值个数为因子个数。另外，还可以通过直观观察碎石图的方式确定因子的个数。 42 2020/4/24 3. 因子旋转根据前述分析，因子分析得到的每个公共因子都对原变量中的每一变量作出一定解释，而解释程度的大小反映在因子载荷矩阵 A 的元素结构上。一般我们可以得到每一列的因子载荷中有一些是比较大的，而另一些比较小，就可以知道该列对应的因子主要解释了哪些变量，以此确定该公共因子的主要特征和内涵。 43 2020/4/24 但有时，因子载荷的大小差异不是非常明显，此时公共因子的命名和解释就比较困难。这时可以使用因子矩阵旋转对因子矩阵作变换，使得旋转之后的载荷矩阵在每一列上元素的绝对值尽量地拉开大小距