计量统计方法-3.pptVIP

  1. 1、本文档共113页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计量统计方法-3

计量统计方法 第二章 经典数理统计方法(三) 回顾 1. 相关分析 2. 回归分析 3. 时间序列分析 4.聚类分析 原理+基本方法+软件使用+结果分析 引申 主成分分析—— 因子分析的一种特殊形式,目的在于从众多指标中找出可以代表所有特征的少数若干指标。(以少概多,以偏概全?) 趋势面分析—— 用数学曲面形式来模拟地理要素的空间分布变化趋势与规律。实际上也是回归分析的一种。 马尔科夫预测—— 地理预测的基础方法之一,以目前状况来预测未来时期内的发展趋势。 5. 主成分分析 地理系统是多要素的复杂系统。在地理学研究中,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。 因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息? 5. 主成分分析 事实上,这种想法是可以实现的,主成分分析方法就是综合处理这种问题的一种强有力的工具。 主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。 从数学角度来看,这是一种降维处理技术。概括起来,这是一种复杂问题简单化的处理方法,类似于非线性转化为线性、多维转化为一维等。 5. 主成分分析 多元分析处理的是多指标的问题。由于指标太多,使得分析的复杂性增加。观察指标的增加本来是为了使研究过程趋于完整,但反过来说,为使研究结果清晰明了而一味增加观察指标又让人陷入混乱不清。 由于在实际工作中,指标间经常具备一定的相关性,故人们希望用较少的指标代替原来较多的指标,但依然能反映原有的全部信息,于是就产生了主成分分析、对应分析、典型相关分析和因子分析等方法。 5. 主成分分析 因子分析: X=BZ+E 其中,X为原始变量矩阵,Z={Z1,Z2,…Zn}为主成分变量,B为公因子负荷系数矩阵,E为残差向量。 当残差E的影响很小可以忽略,并且,Z矩阵各分量Z1,Z2,…Zn之间彼此不相关,此时形成特殊形式的因子分析,称为主成分分析。 因子分析的任务是求出公因子负荷系数矩阵和残差矩阵。 主成分分析的任务是求出公因子负荷系数矩阵。 5. 主成分分析 因子分析和主成分分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子,以较少的几个因子反映原资料的大部分信息。 之所以称其为因子(Facter),而不是聚类(Cluster),是因为它是不可观测的,即不是具体的变量,这与聚类分析不同 。 5.1 主成分分析的基本原理 基本原理: 假定有n个地理样本,每个样本共有p个变量,构成一个n×p阶的地理数据矩阵 5.1 主成分分析的基本原理 当p较大时,在p维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。 主成分分析的两个基本原则: 主成分变量可以综合反映所有变量所涵括的信息; 主成分变量之间是相互独立的。 5.1 主成分分析的基本原理 定义: 记x1,x2,…,xP为原变量指标,z1,z2,…,zm(m≤p)为新变量指标 那么,新变量指标可以表示为: 5.1 主成分分析的基本原理 系数lij的确定原则: ①zi与zj(i≠j;i,j=1,2,…,m)相互无关; ②z1是x1,x2,…,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者;…; zm是与z1,z2,……,zm-1都不相关的x1,x2,…xP, 的所有线性组合中方差最大者。 新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xP的第1,第2,…,第m主成分。 5.1 主成分分析的基本原理 从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2,…,p)在诸主成分zi(i=1,2,…,m)上的荷载 lij( i=1,2,…,m; j=1,2 ,…,p)。 从数学上可以证明,它们分别是相关矩阵m个较大的特征值所对应的特征向量。 5.2 主成分分析的计算步骤 (一)计算相关系数矩阵 rij(i,j=1,2,…,p)为原变量xi与xj的相关系数, rij=rji,其计算公式为 5.2 主成分分析的计算步骤 (二)计算特征值与特征向量 ① 解特征方程    ,常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列 ; ② 分别求出对应于特征值 的特征

文档评论(0)

yan698698 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档