网站大量收购闲置独家精品文档,联系QQ:2885784924

聚类分析(生态)--生态学研究方法.ppt

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
聚类分析(生态)--生态学研究方法

聚类分析方法 第二节 系统聚类分析法 主成分分析及其应用 易见,在坐标系x1ox2中,这些点的两个坐标呈现某中线性关系。我们将x1ox2旋转某个角度?变成新坐标系y1oy2,使 椭圆的长轴方向取y1,短轴方向取y2,如图所示,即 由矩阵表示即为 其中U为坐标旋转矩阵,它是正交矩阵。 如图可见,在新坐标系y1Oy2内数据 (y1i,y2i)) (i=1,2,…,n) 有如下性质 n个点在新坐标系下的坐标y1i和y2i(i=1,2,…,n)的相关性几乎为零。 当椭圆越扁平时,n个点的方差大部分都反映在y1轴的方向上,y2轴方向上的方差则较小。 y1和y2称为原始变量x1和x2的综合指标,从概率统计观点,我们知道,一个随机变量的方差越大,则该变量所包含的信息就越多,而方差为零的随机变量不含任何信息。主成分分析就是选取方差最大的综合指标y1代替二维空间中的点。而这种代替所损失的信息量最小。由此称y1为第一主成分,y2与y1正交,y2有较小的方差,称为第二主成分。 * 聚类方法也称为集群方法。聚类分析(Cluster Analysis)是应用多元统计分析原理研究分类问题的一种数学方法,近年来已被广泛用于地质勘探、天气预报、作物分类等许多方面。生态学数量分类的研究是从20世纪50年代开始的,60年代后许多具有不同观点的传统学派都进行了数量分类的研究。近年来国内也开展了数量分类的研究,并取得了一定的成绩。 第一节 聚类分析基础 聚类分析都是依据一定的条件进行的,我们把这些条件叫做指标或变量,而把要进行分类的对象叫样品。为了根据变量对样品进行分类,就要研究样品间的关系,而描述这种关系的方法通常有两种,一种是距离法;另一种为相似系数法。样品间的距离与相似系数又有多种不同定义方法。依据变量对样品进行分类时,在计算距离或相似系数时,一般与变量的取值关系很大,因此经常将数据进行一些适当的处理。 一、 数据变换 在实际中,不同的变量一般取值的量纲(单位)不同,为了使不同量纲的变量进行比较,消除聚类时量纲对聚类结果的影响,经常对原始数据作变换。常用的变换方法有: (1)中心化变换 中心化变换是先求出每个变量的样本平均值,再从原始数据中减去该变量的均值就得到中心化数据。? 设原始测量样本数据阵为X ? (1) ? n为样本容量(试验、观测次数),p为变量个数。 设中心化后的数据为 则 ? 其中 (2)标准化变换 标准化变换的变换公式为: ? 其中 ? ? sj为第j个变量的标准差, 为第j个变量的样本平均值。 二、 相似系数与距离的定义 目前已设计了多种相似系数和距离,下面介绍在聚类分析中常用的几种。 1. 距离 ? 设 ? 为从总体中取得的一样本容量为n的样本,每个样本点为p维空间中一个向量,用dij表示Xi与Xj的距离,则常用的距离有以下几种: (1)欧氏距离 (5) ? 欧氏距离是在聚类分析中用得最广泛的距离。 ? (2)绝对值距离 (6) ? ? 2. 相似系数 聚类分析除了研究样品的分类外,有时也需要对变量分类。在对变量进行分类时,通常采用相似系数表示变量之间的亲疏程度。常用的相似系数有以下几种: (1)夹角余弦 设Xi, Xj为n维空间中两个向量,(表示两个样品或两个变量的n次观测值)其夹角为?ij。则夹角余弦为: ? (7) ? 如果Xi与Xj(二样品)比较相似,则Xi与Xj的夹角接近于0,从而Cos?ij 接近于1。相似系数的数值范围为[0,1]区间。 (2)相关系数 设rij为n维向量Xi与Xj之间的相关系数,则 ? (8) ? 距离与相似系数的选择是一个比较复杂,带主观性的问题,一般需作具体分析,在多次聚类分析过程中,可多试探几种距离进行聚类,从中总结经验,以选择合适的距离。 在

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档