统计分析之主成分分析.pptx

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本资料来源 地理系统是多要素的复杂系统。在地理学研究中,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间具有一定的相关关系。 解决该问题的一个办法就是筛选变量,即只挑选部分较为重要的变量,以减少变量数,并可缓解相关性带来的麻烦-如逐步回归分析、逐步判别分析等。 换一个角度来看,如果众多的变量间存在着的相关关系,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息? 主成分分析和因子分析就是综合处理这种问题的一种强有力的工具。 §8 主成分分析 问题的提出 问题的提出 主成分分析方法(principal component analysis,PCA )就是综合处理这种问题的一种强有力的工具。它把原来多个变量(显式变量)转化为少数几个综合变量(潜式变量)。综合变量即主成分(principal compontent)综合变量之间相互独立,且能反映原来多个变量的大部分信息。 主成分分析采用的主要原则是使方差最大,以期尽可能多的保留原有变量所包含的信息,同时又能用尽可能少的主成分替代原有变量,从而使问题变的简便。 但是,这些主成分通常并没有明确的专业意义。因子分析是主成分分析的一种推广。它从一定的模型出发,找出几个反映原有变量的公共因子,并力求使之有较为合理的专业解释。 §8 主成分分析 §8 主成分分析 问题的提出 [引例8-1] 2000年全国各地 区经济效益主要指标有以下 8个:GDP(亿元)、工业 增加值(%)、总资产贡 献率(%)、资产负债率 (%)、流动资产周转次 数(次/年)、工业成本费 用利润率(%)、全员劳动 生产率(元/人.年)、产品 销售率(%)。 §8 主成分分析 §8 主成分分析 问题的提出 §8 主成分分析 问题的提出 §8 主成分分析 什么是主成分分析 主成分分析的数学模型 主成分分析的主要步骤 如何在SPSS软件中进行主成分分析 §8 主成分分析 什么是主成分分析 主成分概念首先由Kal parson在1901年提出,不过当时 只对非随机变量来讨论的。1933年Hotelling将这个概念推 广到随机向量。 主成分分析(Principal Components Analysis ,PCA)也 称为主分量分析,是一种通过降维来简化数据结构的方 法,即如何把多个变量(变量)转化为少数几个综合变量 (综合变量),而这几个综合变量可以反映原来多个变量 的大部分信息。 为了使这些综合变量所含的信息互不重叠,应要求它们之间互不相关。 §8 主成分分析 什么是主成分分析 在实际问题中,经常遇到多变量(指标)问题,而且变量之间有一定的相关性。变量多且变量间有一定的相关性,势必增加了分析问题的复杂性。 主成分分析就是设法将原来变量重新组合成一组新的互相无关的几个综合变量来代替原来变量,同时根据实际需要从中可取几个较少的综合变量尽可能多地反映原来变量的信息。 §8 主成分分析 基本思想 主成分分析就是设法将原来众多具有一定相关性的变量(如p个变量),重新组合成一组新的相互无关的综合变量来代替原来变量。怎么处理? 通常数学上的处理就是将原来p个变量作线性组合作为新的综合变量。如何选择? 如果将选取的第一个线性组合即第一个综合变量记为F1,自然希望F1尽可能多的反映原来变量的信息。怎样反映? 最经典的方法就是用方差来表达,即var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中所选取的F1应该是方差最大的,故称之为第一主成分(principal component I)。 §8 主成分分析 基本思想 如果第一主成分不足以代表原来p个变量的信息,再考虑选取F2即第二个线性组合。F2称为第二主成分(principal component II)。 F1和F2的关系? 为了有效地反映原来信息,F1已有的信息就不再出现在F2中,即cov(F1,F2)=0。依此类推,可以获得p个主成分。因此,这些主成分之间是互不相关的,而且方差依次递减。在实际中,挑选前几个最大主成分来表征。标准? 各主成分的累积方差贡献率80%或特征根1。 §8 主成分分析 数学模型 假定有n个地理样本,每个样本共有p个变量,构成一个n×p阶的地理数据阵 当p较大时,在p维空间中考察问题比较麻烦。为了克服这一困 难,就需要进行降维处理,即用较少的几个综合变量代替原来 较多的变量变量,而且使这些较少的综合变量既能尽量多地反 映原来较多变量变量所反映的信息。 §8 主成分分析 数学模型 引例8-1中,有31个样本,每个

文档评论(0)

文单招、专升本试卷定制 + 关注
官方认证
服务提供商

专注于研究生产单招、专升本试卷,可定制

版权声明书
用户编号:8005017062000015
认证主体莲池区远卓互联网技术工作室
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0G1JGM00

1亿VIP精品文档

相关文档