1
主 成 分 分 析
与 因 子 分 析
Principal Components Analysis
Factor Analysis
安徽医科大学公共卫生学院 潘发明
2
主要内容:
第一节 主成分分析
第二节 因子分析
3
第一节
主成分分析
Principal Components Analysis
4
一、基本思想
数据的降维、数据的解释
将原来众多具有一定相关性的指标,组
合成一组新的相互无关的综合指标。
从中选取几个较少的综合指标尽可能多
的反映原来众多指标的信息。
这种既减少了指标的数目又抓住了主要矛
盾的做法有利于问题的分析和处理。
5
6
如何利用这些指标对每一儿童的生长发育
作出正确评价?
仅用单一指标:
结论片面;难免带有偏性;
没有充分利用原有数据信息。
利用所有指标:
各指标评价的结论可能不一致,使综合
评价困难;
工作量大。
7
找出几个综合指标(长度、围度等),这些综合指标是原始指标的线性组合,既保留了原始指标的信息,且互不相关,从而达到降维。
各综合指标提供的“信息”量大小用其方差来衡量。
衡量一个指标的好坏除了正确性与精确性外,还必须能充分反映个体间的变异,一
项指标在个体间的变异越大,提供的信息
量越多。
8
主成分的概念
例题
对几个儿童测量了身高(x1)、体重(x2)两个指标。显然x1与x2间是高度相关的,即身高包含了体重的信息,体重也同样包含了身高的信息。若以x1为横轴x2为纵轴作散点图,可以发现几个个体的散点分布在一条直线附近。
9
10
11
12
13
如何用SPSS软件中的菜单进行标准化转化?
14
15
16
17
18
可依此类推,直到求出第m主成份。
19
20
(二)主成分的性质
21
22
主成分个数的选取
(1)前k个主成分的累积贡献率70%。
(2)主成分Ci的特征值i ≥ 1。
23
主成份分析的应用
主成分分析本身往往并不是目的,而是达到目的的一种手段。因此,它多用在大型研究项目的某个中间环节中。例如,把它用在多元回归中,便产生了主成分回归,这种回归具有一些优良性质。另外,它还可以用于聚类、判别分析等。这里主要介绍主成分评价和主成分回归。
24
25
实例
原始的数据库结构
26
原始数据标准化转化(消除度量衡不同的影响)
27
六个变量的标准化转化值自动保存在原始数据库中
28
各变量标准化值相关系数矩阵
29
由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率
方差分析主成分提取表
初始因子载荷矩阵
30
主成分分析的结果 如何来判断
31
因为“Component Matrix”是指初始因子载荷矩阵, 每一个载荷量表示主成分与对应变量的相关系数。
用主成分载荷矩阵 中的数据除以主成分相对应的特征值开平方根便得到1个主成分中每个指标所对应的系数。将初始因子载荷矩阵中的1列数据输入( 可用复制粘贴的方法) 到数据编辑窗口( 为变量B1) , 然后利用“Transform→Compute Variable”, 在Compute Variable对话框中输入“A1=B1/SQR(4.417)。将得到的特征向量与标准化后的数据相乘, 然后就可以得出主成分表达式[注: 因本例只是为了说明如何在SPSS 进行主成分分析, 故在此不对提取的主成分进行命名, 有兴趣的读者可自行命名。
32
2.列出主成分表达式
C1=0.439*Z常识+0.440*Z算术+0.330*Z理解+0.305*Z填图+0.395*Z积木+0.436*Z译码
后根据主成分值排序进行综合评价
如果有多个主成分可以得到主成分综合模型
C=[∑( 1 *C1 +2 *C2 …+… K *CK )]/m(具体例题见PDF文件)
33
主成分分析的应用
1.对原始指标进行综合
以互不相关的较少个综合指标反应众多原
始指标提供的信息。
主成分回归(解决多元共线问题)。
2.对个体进行综合评价
34
3.进行探索性分析
利用因子载荷阵,找出影响各综合指标的
主要原始指标。
4.对样品进行分类
利用主成分得分对样品进行分类:
C1为急性炎症成分
C2为慢性炎症成分
C3为癌变成分
35
主成分回归
36
37
38
39
40
主成分分析的正确应用
41
42
43
第二节
因子分析
Factor Analysis
44
一、因子分析基本思想
从分析多个可观测的原始指标的相关关系入手,找到支配这种相关关系的有限个不可观测的潜在变量。是多元分析中处理降维的一种统计方法(概念起源于20世纪初Ka
您可能关注的文档
- 中国汽车行业未来发展趋势研究技朮方案.pptx
- 中国社保综述及详解.ppt
- 中国史(现代史)知识树详解.ppt
- 中国现代史复习技朮方案.ppt
- 中国新闻事业的诞生与初步发展(课外补充)技朮方案.ppt
- 中国直销公司事业说明(沟通版)-直销公司信息文档技朮方案.ppt
- 中国资本市场发展技朮方案.ppt
- 中韩关系浅析技朮方案.ppt
- 中厚板不锈钢等离子弧切割详解.ppt
- 中华航协基本空气动力学简报详解.ppt
- 2025-2026学年天津市和平区高三(上)期末数学试卷(含解析).pdf
- 2025-2026学年云南省楚雄州高三(上)期末数学试卷(含答案).pdf
- 2025-2026学年甘肃省天水市张家川实验中学高三(上)期末数学试卷(含答案).docx
- 2025-2026学年福建省厦门市松柏中学高二(上)期末数学试卷(含答案).docx
- 2025-2026学年广西钦州市高一(上)期末物理试卷(含答案).docx
- 2025-2026学年河北省邯郸市临漳县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省石家庄二十三中七年级(上)期末历史试卷(含答案).docx
- 2025-2026学年海南省五指山市九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省唐山市玉田县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省邢台市市区九年级(上)期末化学试卷(含答案).docx
原创力文档

文档评论(0)