- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析操作步骤.doc
SPSS 中主成分分析的基本操作
Xiaowenzi22 与 pinksss 共同制作
阐述主成分分析法的原理
主成分分析是设法将原来众多具有一定相关性(比如 P 个指标),重新组合 成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原
来 P 个指标作线性组合,作为新的综合指标。最经典的做法就是用 F1(选取的第 一个线性组合,即第一个综合指标)的方差来表达,即 Var(F1)越大,表示 F1 包 含的信息越多。因此在所有的线性组合中选取的 F1 应该是方差最打的,故称 F1
为第一主成分。如果第一主成分不足以代表原来 P 个指标的信息,再考虑选取
F2 即选第二个线性组合,为了有效地反映原来信息,F1 已有的信息就不需要再出 现再 F2 中,用数学语言表达就是要求 Cov(F1, F2)=0,则称 F2 为第二主成分,依 此类推可以构造出第三、第四,……,第 P 个主成分。
主成分模型: F1=a11X11+a21X21+……+ap1Xp F2=a12X12+a22X22+……+ap2Xp
…… Fp=a1mX11+a2mX22+……+apmXp
其中 a1i, a2i, ……,api(i=1,……,m)为 X 的协差阵Σ的特征值多对应的特征向
量,X1, X2, ……, Xp 是原始变量经过标准化处理的值(因为在实际应用中,往往 存在指标的量纲不同,所以在计算之前先消除量纲的影响,而将原始数据标准
化)。
A=( aij ) p?m =(?1 , ? 2 , …,? m ), R? i ? ?i? i , R 为相关系数矩阵,
?i、? i 是相应
的特征值和单位特征向量,
上述方程组要求:
?1 ≥ ?2 ≥…≥ ? p ≥0
1、a2
2 +……+a2
=1 (i=1,……,m)
2、 A?A ? I m
(A=( aij ) p?m =(?1 , ? 2 , …,? m ),A 为正交矩阵)
3、Cov(Fi ,Fj )=?i ? ij ,
? ? ? 0
ij ? 1
i ? j
i ? j
操作步骤:
一、数据标准化
1、
2、在弹出对话框中把需标准化的变量选进 Variable 去
并在下面的提示前打钩
3、然后点“OK”
4、数据编辑窗内将出现结果 二、主成分分析基本操作
1、
2、选择后弹出现下面的对话框
3、把标准化后的数据都选进 Variables 去
4、点击
5、弹出现下面的对话框
6、在对话框的空白处填 0,记得上面的图中要选中前面的点
7、点击 continue 钮
8、返回上个对话框
9、如需要得到相关系数矩阵,点击
10、弹出下面的对话框
在 Coefficients 前的方框打上钩
11、然后点击 continue 钮
12、返回上个对话框,点击“OK”
Total Variance Explained
Component
1
2
3
4
5
6
7
8
Initial Eigenvalues Extraction Sums of Squared Loadings
Total % of Variance Cumulative % Total % of Variance Cumulative %
3.849 48.118 48.118 3.849 48.118 48.118
1.808 22.594 70.712 1.808 22.594 70.712
1.306 16.329 87.042 1.306 16.329 87.042
.595 7.443 94.485 .595 7.443 94.485
.289 3.608 98.092 .289 3.608 98.092
.078 .977 99.069 .078 .977 99.069
.057 .718 99.787 .057 .718 99.787
.017 .213 100.000
Extraction Method: Principal Component Analysis.
三、提取特征向量
1、在计算主成分的步骤中将出现因子载荷矩阵,我们可以取得每个主成分的方 差,即特征根,它的大小表示了对应主成分能够描述原来所有信息的多少(更多 情况下是由方差贡献率来反映)。一般来讲,为了达到降维的目的,我们只提取 前几个主成分,由于前 3 个特征值累计贡献率达到 87.042%,根据累计贡献率大 于 85%的原则,故选取前三个特征值。所以决定用三个新变量来代替原来的七个 变量。但这三个新变量的表达还不能从输出窗口中直接得到,因为“Component Matrix
文档评论(0)