实用统计方法——第一讲主成分分析.pptVIP

实用统计方法——第一讲主成分分析.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
前 言;统计是什么?;统计是什么?;统计学可以应用于几乎所有的领域:; 统计是什么?;以归纳为主要思维方式的统计不是以演绎为主的数学。 统计可应用于各个不同学科,在有些学科已经有其特有的方法和特点;如生物统计(biostatistics)、经济计量学(econometrics)以及目前很热门的生物信息(bioinformation)和数据挖掘(Data Mining)的方法主体都是统计。;你想过下面的问题吗?;可以想象出的统计应用例子;统计的一些做法;统计需要的知识;统计和数学的区别;第一讲 主成分分析;主成分分析的基本原理 主成分分析的计算 主成分分析应用实例 几个问题 ; 在社会经济的研究中,为了全面系统的分析和研究问题,必须考虑许多经济指标,这些指标能从不同的侧面反映我们所研究的对象的特征,但在某种程度上存在信息的重叠,变量太多,这无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。 因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息? ; 事实上,这种想法是可以实现的,主成分分析方法就是综合处理这种问题的一种强有力的工具。 主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。 从数学角度来看,这是一种降维处理技术。 ;一、主成分分析的基本原理 ; 当p较大时,在p维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。; 定义:记x1,x2,…,xP为原变量指标,z1,z2,…,zm(m≤p)为新变量指标;系数lij的确定原则: ① zi与zj(i≠j;i,j=1,2,…,m)相互无关;; 从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2 ,…, p)在诸主成分zi(i=1,2,…,m)上的载荷 lij( i=1,2,…,m; j=1,2 ,…,p)。因此主成分分析的关键就是确定这些系数。 从数学上容易知道,从数学上可以证明,它们分别是的协方差(相关)矩阵的m个较大的特征值所对应的特征向量。P54 定理2.1.1 ;二、主成分的计算 ;相关系数(correlation coefficient ) 协方差数据矩阵的每一列对应一个变量的n个测量值,任意两列之间可以计算两变量间的协方差cov(i,j),i=j时,;协方差矩阵;相关系数矩阵;协方差矩阵与相关矩阵的关系 P58;计算步骤(以相关矩阵为例);第二步:计算特征值与特征向量 ① 解特征方程    ,常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列 ; ;③ 计算主成分贡献率及累计贡献率 ▲贡献率:; MATLAB的一个命令;输出变量: ;三、 主成分分析方法应用实例; 相关矩阵为: 相关阵R的特征值分别为2.077,0.919,0.004, 前两个主成分的累计贡献率为99.866%。 这说明第三个主成分所起作用非常小,可以只要两个主成分 。 课后练习:用MATLAB求本例中16个样本的 第一、第二主成分值及其对应的载荷向量。; 下面,我们根据表1给出的数据,对某农业生态经济系统做主成分分析。 ;步骤如下:(1)将表中的数据作标准差标准化处理,然后将它们代入公式计算相关系数矩阵(见表2)。 ; (2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表3)。由表3可知,第一,第二,第三主成分的累计贡献率已高达86.596%(大于85%),故只需要求出第一、第二、第三主成分z1,z2,z3即可。 ;表3 特征值及主成分贡献率 ; (3)对于特征值=4.6610,=2.0890,=1.0430分别求出其特征向量e1,e2,e3,再用公式计算各变量x1,x2,…,x9在主成分z1,z2,z3上的载荷(表4)。 ;表4 主成分载荷 ; ①第一主成分z1与x1,x5,x6,x7,x9呈显出较强的正相关,与x3呈显出较强的负相关,而这几个变量则综合反映了生态经济结构状况,因此可以认为第一主成分z1是生态经济结构的代表。 ②第二主成分z2与x2,x4,x5呈显出较强的正相关,与x1呈显出较强的负相关,其中,除了x1为人口总数外,x2,x4

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档