- 1、本文档共94页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1
主 成 分 分 析
与 因 子 分 析
Principal Components Analysis
Factor Analysis
安徽医科大学公共卫生学院 潘发明
2
主要内容:
第一节 主成分分析
第二节 因子分析
3
第一节
主成分分析
Principal Components Analysis
4
一、基本思想
数据的降维、数据的解释
将原来众多具有一定相关性的指标,组
合成一组新的相互无关的综合指标。
从中选取几个较少的综合指标尽可能多
的反映原来众多指标的信息。
这种既减少了指标的数目又抓住了主要矛
盾的做法有利于问题的分析和处理。
5
6
如何利用这些指标对每一儿童的生长发育
作出正确评价?
仅用单一指标:
结论片面;难免带有偏性;
没有充分利用原有数据信息。
利用所有指标:
各指标评价的结论可能不一致,使综合
评价困难;
工作量大。
7
找出几个综合指标(长度、围度等),这些综合指标是原始指标的线性组合,既保留了原始指标的信息,且互不相关,从而达到降维。
各综合指标提供的“信息”量大小用其方差来衡量。
衡量一个指标的好坏除了正确性与精确性外,还必须能充分反映个体间的变异,一
项指标在个体间的变异越大,提供的信息
量越多。
8
主成分的概念
例题
对几个儿童测量了身高(x1)、体重(x2)两个指标。显然x1与x2间是高度相关的,即身高包含了体重的信息,体重也同样包含了身高的信息。若以x1为横轴x2为纵轴作散点图,可以发现几个个体的散点分布在一条直线附近。
9
10
11
12
13
如何用SPSS软件中的菜单进行标准化转化?
14
15
16
17
18
可依此类推,直到求出第m主成份。
19
20
(二)主成分的性质
21
22
主成分个数的选取
(1)前k个主成分的累积贡献率70%。
(2)主成分Ci的特征值i ≥ 1。
23
主成份分析的应用
主成分分析本身往往并不是目的,而是达到目的的一种手段。因此,它多用在大型研究项目的某个中间环节中。例如,把它用在多元回归中,便产生了主成分回归,这种回归具有一些优良性质。另外,它还可以用于聚类、判别分析等。这里主要介绍主成分评价和主成分回归。
24
25
实例
原始的数据库结构
26
原始数据标准化转化(消除度量衡不同的影响)
27
六个变量的标准化转化值自动保存在原始数据库中
28
各变量标准化值相关系数矩阵
29
由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率
方差分析主成分提取表
初始因子载荷矩阵
30
主成分分析的结果 如何来判断
31
因为“Component Matrix”是指初始因子载荷矩阵, 每一个载荷量表示主成分与对应变量的相关系数。
用主成分载荷矩阵 中的数据除以主成分相对应的特征值开平方根便得到1个主成分中每个指标所对应的系数。将初始因子载荷矩阵中的1列数据输入( 可用复制粘贴的方法) 到数据编辑窗口( 为变量B1) , 然后利用“Transform→Compute Variable”, 在Compute Variable对话框中输入“A1=B1/SQR(4.417)。将得到的特征向量与标准化后的数据相乘, 然后就可以得出主成分表达式[注: 因本例只是为了说明如何在SPSS 进行主成分分析, 故在此不对提取的主成分进行命名, 有兴趣的读者可自行命名。
32
2.列出主成分表达式
C1=0.439*Z常识+0.440*Z算术+0.330*Z理解+0.305*Z填图+0.395*Z积木+0.436*Z译码
后根据主成分值排序进行综合评价
如果有多个主成分可以得到主成分综合模型
C=[∑( 1 *C1 +2 *C2 …+… K *CK )]/m(具体例题见PDF文件)
33
主成分分析的应用
1.对原始指标进行综合
以互不相关的较少个综合指标反应众多原
始指标提供的信息。
主成分回归(解决多元共线问题)。
2.对个体进行综合评价
34
3.进行探索性分析
利用因子载荷阵,找出影响各综合指标的
主要原始指标。
4.对样品进行分类
利用主成分得分对样品进行分类:
C1为急性炎症成分
C2为慢性炎症成分
C3为癌变成分
35
主成分回归
36
37
38
39
40
主成分分析的正确应用
41
42
43
第二节
因子分析
Factor Analysis
44
一、因子分析基本思想
从分析多个可观测的原始指标的相关关系入手,找到支配这种相关关系的有限个不可观测的潜在变量。是多元分析中处理降维的一种统计方法(概念起源于20世纪初Ka
您可能关注的文档
最近下载
- 妊娠期间孕妇心理护理.pptx VIP
- 2025山东威海热电集团有限公司招聘37人考试备考题库及答案解析.docx VIP
- 2025山东威海热电集团有限公司招聘37人笔试参考题库附答案解析.docx VIP
- 2025山东威海热电集团有限公司招聘37人笔试备考试题及答案解析.docx VIP
- 2025山东威海热电集团有限公司招聘37人笔试模拟试题及答案解析.docx VIP
- 伤口造口失禁专科护士.docx VIP
- 伤口造口专科护士试题 造口试题 .pdf VIP
- 施工脚手架通用规范完整版2024.pdf VIP
- 临床执业医师妇产科学复习指导.pdf VIP
- NY∕T 391-2021 绿色食品 产地环境质量.pdf
文档评论(0)