主成分分析法在排序中的实际应用.pptVIP

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析法在排序中的实际应用.ppt

* * 主成分分析法在植被排序 中的应用 Contents 排序方法的比较 主坐标分析 典范主分量分析 主分量分析 排序的概述 排序的概述 50年代,许多学者强调植被的连续性,认为分类 是确定植被间断性的有效方法,但不能用于解释 植被的连续性,因此,对排序方法才开始研究而 得以发展。当时的排序是用于分析群落 之间的连续分布关系。 到50年代后期,排序概念已趋于完善,其不仅排列样方,也可以排列植物种及环境因素,用于研究群落之间、群落与成员之间、群落与其环境之间的复杂关系。 排序最初的概念是指植被样方在某一空间(一维或多维)的排列,这里的空间指植物种空间或环境因素空间。它是随着“植被连续体”概念的提出而诞生的。 排序的目的和意义 排序的过程是将样方或植物种排列在一定的空间,使得排序轴能够反映一定的生态梯度,从而能够解释植被或植物种的分布与环境因子间的关系,也就是说排序是为了揭示植被-环境间的生态关系。 因此,排序也叫梯度分析(gradient analysis)。 简单的梯度分析是研究植物种和植物群落在某一环境梯度或群落线(coenocline)上的变化,也就是一维排序。 复杂的梯度分析是揭示植物种和群落在某些环境梯度(群落面coenoplane或群落体coenocube)上的变化,这相当于二维或多维排序。 直接梯度分析 间接梯度分析 梯度分析 同时使用植物种的 组成数据和环境因子组成 数据的排序 只使用植物种的组成 数据的排序 直接梯度分析因为使用了环境因子组成 数据,排列轴的生态意义往往是一目 了然的,在结果解释上比较容易。 间接梯度分析完成后,研究者需要通过 再分析找出排列轴的生态意义,再用其 解释植物群落或植物种在排序图上的分布 排序的结果一般用直观的排序图表示, 排序图通常只能表现出三维坐标。 排序的一个重要内容就是降低维数,减少坐标轴的数目 降低维数往往会损失信息 一个好的排序方法应该是由降低维数引起的 信息损失尽量少,即发生最小的畸变,也就 是说它的低维排序轴包含大量的生态信息。 二维排序图 三维排序图 一维排序图 排序结果 排序和分类 由于排序的结果能够客观地反映群落间的关系,所以它可以与分类方法结合使用,而检验分类的结果,就是先用某一分类方法对样方进行分类。 比如用传统的定性方法或某一数量方法进行分类,然后再在排序图上圈定群落的界限,这样可以直观地看出各植被类型间的关系,以检验分类的合理性,并且可以用排序轴所含的生态意义来帮助解释分类的结果。 正因为如此,有些学者也将排序归入植被数量分类方法中。 在排序方法中,相似关系的计算,一般各排序方法都有特殊的要求而成为方法的组成部分; 所有排序方法对二元数据和数量数据都适合,没有特殊要求。 分类方法有的只能使用二元数据。 种类环境关系模型 所有排序方法都是基于一定的模型之上,这种模型反映植物种和环境之间的关系以及在某一环境梯度上的种间关系。最常用的关系模型有两种: 关系模型 线性模型 非线性模型 直线线性关系 曲线线性关系 二次曲线模型(高斯模型或高斯曲线) 基于线性模型上所建立的排序方法 线性排序 (以主分量分析(PCA)为主) 基于单峰模型上的排序 非线性排序 (以对应分析(CA)为主) PCA的分析过程 1 标准化 种中心化: 样方中心化: 中心化后的数据矩阵为: 2 计算属性间内积矩阵S 3 求内积矩阵S的特征根 根据S矩阵的特征方程 求得P个特征根,并依大小排列: 4 求特征根所对应的特征向量 根据S矩阵的特征方程,第i个特征根和第i个特征向量有如下关系: 解方程可以得到特征向量 , 重复多次可得出P个特征向量,构成矩阵U 5 求排序坐标矩阵Y 6 求属性的负荷量 是第i个属性(种)对第j个主分量的负荷量。 矩阵表示: 例子 假定调查得到6个样方两个种的数据,得原始数据矩阵Z为 第一步,数据中心化得 第二步,计算内积矩阵S 第三步,求S的特征根 得 第四步,求S的特征向量 展开两个联立方程 分别解联立方程得特征向量的分量比 再依正交矩阵的特点 特征向量矩阵 排序结果用图形表示,得6个样方的PCA排序图: 第五步,求排序坐标 1 2 3 4 5 6 PCA是首次在低维空间排列样方而包含了大多数数据信息的多元排序方法,受到不少学者的喜爱,它在排序方法发展的过程中有着重要的地位。 PCA的最大缺点是它的线性模型,一般认为,线性模型不能很好的反映植物种、植被与环境间的关系,因此PCA结果的解释较为困难而且带有较大的主观性。 2 典范主分量分析 为了更好地研究环境因子对群落的作用,将主分量分析与环境因子结合起来,就形成了典范主分量分析(CPCA)。由于它结合了环境矩

文档评论(0)

youngyu0329 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档