- 3
- 0
- 约2.54千字
- 约 31页
- 2020-09-11 发布于湖北
- 举报
12 100 主成分分析 主成分分析的基本原理 主成分分析的计算步骤 主成分分析方法应用实例 ;.; * 在实际问题研究中,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。 因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息? 问题的提出: ;.; * 事实上,这种想法是可以实现的,主成分分析方法就是综合处理这种问题的一种强有力的工具。 主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。 从数学角度来看,这是一种降维处理技术。 ;.; * 例如,某人要做一件上衣要测量很多尺寸,如身长、袖长、胸围、腰围、肩宽、肩厚等十几项指标,但某服装厂要生产一批新型服装绝不可能把尺寸的型号分得过多 ?而是从多种指标中综合成几个少数的综合指标,做为分类的型号,利用主成分分析将十几项指标综合成3项指标,一项是反映长度的指标,一项是反映胖瘦的指标,一项是反映特体的指标。 ;.; * 一、主成分分析的基本原理 假定有n个样本,每个样本共有p个变量,构成一个n×p阶的数据矩阵 (1.1) ;.; * 当p较大时,在p维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。 ;.; * 定义:记x1,x2,…,xP为原变量指标,z1,z2,…,zm(m≤p)为新变量指标 (1.2) 系数lij的确定原则: ① zi与zj(i≠j;i,j=1,2,…,m)相互无关; ;.; * ② z1是x1,x2,…,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者;…; zm是与z1,z2,……,zm-1都不相关的x1,x2,…xP, 的所有线性组合中方差最大者。 则新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xP的第1,第2,…,第m主成分。 ;.; * 从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2 ,…, p)在诸主成分zi(i=1,2,…,m)上的荷载 lij( i=1,2,…,m; j=1,2 ,…,p)。 从数学上可以证明,它们分别是相关矩阵m个较大的特征值所对应的特征向量。 ;.; * 二、主成分分析的计算步骤 设有 n 个样品,每个样品观测 p 个指标,将原始数据写成矩阵 1.将原始数据标准化。这里不妨设上边矩阵已标准化了。 2.建立变量的相关系数阵: ;.; * 3.求R的特征根 及相应的单位特征向量: 4.写出主成分 ;.; * 计算主成分贡献率及累计贡献率 贡献率 累计贡献率 一般取累计贡献率达85%~95%的特征值 所对应的第1、第2、…、第m(m≤p)个主成分。 ;.; * 三、 实例演示 例 对全国30个省市自治区经济发展基本情况的八项指标作主成分分析,原始数据如下: ;.; * ;.; * ;.; * ;.; * 第一步 将原始数据标准化。 第二步 建立指标之间的相关系数阵R如下 ;.; * 第三步 求R的特征值和特征向量。 ;.; * 从上表看,前3个特征值累计贡献率已达89.564%,说明前3个主成分基本包含了全部指标具有的信息,我们取前3个特征值,并计算出相应的特征向量: ;.; * 因而前三个主成分为: 第一主成分: 第二主成分: ;.; * 第三主成分: 在第一主成分的表达式中第一、二、三项指标的系数较大,这三个指标起主要作用,我们可以把第一王成分看成是由国内生产总值、固定资产投资和居民消费水平所该划的反映经济发展状况的综合指标; 在第二主成分中,第四、五、六、七项指标的影响大,且第六、七项指标的影响尤其大,可将之看成是反映物价指数、职工工资和货物周转量的综合指标; 在第三主成分中,第八项指数影响最大,远超过其它指标的影响,可单独看成是工业总产值的影响。 ;.; * 四.主成分分析的应用 1.主成分分析用于系统评估 利用主成分F1…,Fp做线性组
您可能关注的文档
- 经典主题班会《直面挫折---微笑面对生活》PPT课件.ppt
- 主题班会_关注安全_珍爱生命课件回顾.ppt
- 主题班会:责任心-课件[新版].ppt
- 主题班会:学习贵在坚持演示版.ppt
- (可修改)主题班会:加油中国.ppt
- 完整版主生产计划和MRP计划计算.ppt
- 主接线及运行方式全版.ppt
- 复习主顾开拓的方法.ppt
- 教案主分量分析.ppt
- 主动语态和被动语态课件全面.ppt
- 2018年全年真题(上午+下午).docx
- 中级信息系统管理工程师2009下半年上午试题.doc
- 2026年郑州新高考历史全程复习规划与备考指南(一轮+二轮+三轮)含易考题、常考题、易错题.docx
- 2026年珠海新高考历史学科全程复习规划与备考指南(一轮+二轮+三轮)含易考题、常考题、易错题.docx
- 辽宁省点石联考2025-2026学年高一上学期11月期中考试物理试题(解析版).docx
- 清单11 记叙文阅读之朗读设计 表达技巧 主旨情感 开放探究(知识 方法 能力清单)(原卷版)-2026年中考语文二轮复习讲练(全国通用).docx
- 热点11 《中华人民共和国治安管理处罚法》(热点专练)(解析版)(全国通用) 2026年中考道德与法治一轮复习讲练.docx
- 专题02 常用地理计算(讲义)(全国通用)(解析版)-2026年中考地理二轮复习讲练.docx
- 小说易错02 重点情节理解偏差(选择题)(易错专练)(全国通用)(解析版)-2026年高考语文二轮复习讲练.docx
- 热点08 新质生产力与科技强国之路——从DeepSeek到锂电池技术突破(热点专练)(全国通用)(原卷版)-2026年高考历史二轮复习讲练.docx
最近下载
- 三下语文阅读理解与答题模板 .pdf VIP
- 人教版二年级下册数学全册新素养教学课件(配2026年春改版教材).pptx
- 智能座舱系统调试与测试课件 2人机交互系统.pptx VIP
- 2025年初中数学教师基本功大赛试题.docx VIP
- 无人机基础理论培训课件.pptx
- 符号建构与身份表演:符号互动论框架下趣缘群体社交机制研究--基于豆瓣MBTI小组的数字民族志.pdf
- T∕ZZB 1653-2020 一次性细胞冻存管(聚丙烯).pdf VIP
- 无障碍设施建设图集.pdf VIP
- 大学英语自我介绍课件.pptx VIP
- (正式版)S-H-T 1844-2024 工业用乙烯、丙烯中痕量氢气、一氧化碳、二氧化碳的测定 气相色谱-氦离子化检测法.docx VIP
原创力文档

文档评论(0)