主成分分析方法.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

算出第一主成分I:特征值为37.9,特征向量为第二主成分II:特征值为6.5,特征向量为第30页,共60页,星期日,2025年,2月5日特征向量的方向由I、II中包括的两个数字控制第一主成分Z1的方差为37.9,第二主成分Z2的方差为6.5。两者之和恰为X1和X2的总方差44.4。可见,两个主成分Z1、Z2所代表的信息分别为86%和14%。如果用Z1代表原来的数据,则仅损失信息14%。但若用X1和X2来代表原来的数据,则将损失信息46%或54%。第31页,共60页,星期日,2025年,2月5日3、主成分得分的计算根据(8-3)式,得到主成分的表达式为第32页,共60页,星期日,2025年,2月5日原始数据的主成分得分Z1Z2Z1Z23.480.9315.422.410.14-3.616.171.747.711.213.085.799.96-0.7819.080.5111.46-2.119.83-0.156.123.9321.33-1.4714.37-3.3314.495.8812.030.0619.652.679.693.4520.974.1711.941.4723.971.5316.44-2.4926.130.9611.852.8828.21.816.260.33第33页,共60页,星期日,2025年,2月5日二、主成分分析的步骤对原始地理数据第34页,共60页,星期日,2025年,2月5日进行标准化处理(标准差标准化),即其中第35页,共60页,星期日,2025年,2月5日计算相关系数矩阵R第36页,共60页,星期日,2025年,2月5日计算特征值和特征向量根据特征方程计算特征值,即解的特征多项式,求并使特征值按从大到小的顺序排列,即列出关于每个特征值的特征向量第37页,共60页,星期日,2025年,2月5日计算主成分贡献率及累计贡献率▲贡献率:▲累计贡献率:一般取累计贡献率达85—95%的特征值所对应的第一、第二、…、第m(m≤p)个主成分第38页,共60页,星期日,2025年,2月5日计算主成分载荷(主成分Zk与变量xi之间的相关系数)第39页,共60页,星期日,2025年,2月5日各主成分的得分:第40页,共60页,星期日,2025年,2月5日§3特征值与特征向量的计算方法雅可比法适合于对称矩阵任一实对称矩阵A,均存在一正交变换矩阵T,使那么就是A的特征向量,T的列向量就是相应的特征向量第41页,共60页,星期日,2025年,2月5日二维情况如令则将原始矩阵A化成了对角矩阵。由于T是正交阵,A和Λ对角线元素之和都等于a11+a22第42页,共60页,星期日,2025年,2月5日第1页,共60页,星期日,2025年,2月5日问题的提出地理系统是多要素的复杂系统。变量太多,会增加分析问题的难度与复杂性,而且多个变量之间是具有一定的相关关系的能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息?主成分分析方法就是综合处理这种问题的一种强有力的工具。主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理技术第2页,共60页,星期日,2025年,2月5日§1主成分分析方法的基本原理假定有n个地理样本,每个样本共有p个变量,构成一个n×p阶的地理数据矩阵第3页,共60页,星期日,2025年,2月5日当p较大时,在p维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维处理.要求:较少的几个综合指标尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的第4页,共60页,星期日,2025年,2月5日例,成绩数据100个学生的数学、物理、化学、语文、历史、英语的成绩如下表(部分)。第5页,共60页,星期日,2025年,2月5日对于多维变量的情况和二维类似,也有高维的椭球,只不过无法直观地看见首先把高维椭球的主轴找出来,再用代表大多数数据信息的最长的几个轴作为新变量;这样,主成分分析就基本完成

文档评论(0)

xiaoyao2022 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档