jldl.4.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
jldl.4

§4 系统聚类分析 聚类分析的意义和作用 聚类要素的数据处理 距离的计算 聚类方法——系统聚类法 直接聚类法 最短距离聚类法 最远距离聚类法 系统聚类法计算类之间距离的统一公式 系统聚类分析实例 一、聚类分析的意义和作用 聚类分析就是根据地理变量(或指标或样品)的属性或特征的相似性或亲疏程度,用数学的方法把它们逐步地分型划类,最后得到一个能反映个体或站点之间、群体之间亲疏关系的客观的分类系统。 事先无需知道分类对象的分类结构 聚类分析方法的应用 地理分区 物种聚类 对地理要素进行聚类 二、聚类要素的数据处理 数据的对数变换 变换后的数据比原始数据数量变化幅度减小,而且相对的均匀了。 在聚类分析中,常用的数据处理方法有: ① 总和标准化。分别求出各聚类要素所对应的数据的总和,以各要素的数据除以该要素的数据的总和,即 这种标准化方法所得到的新数据满足 例题:表3.4.1给出了某地区九个农业区的七项指标,它们经过极差标准化处理后,如表3.4.2所示。 三、聚类分析的统计量 聚类分析是通过聚类对象之间的相似性或亲疏程度来聚类的,指标分为相似性指标和不相似性指标。 1、相似性指标(相似系数) ① 相关系数r ② 夹角余弦cosθ 三、聚类分析的统计量 2、不相似性指标(距离系数) ① 绝对值距离 ② 欧氏距离 ③ 明科夫斯基距离 四、聚类方法 系统聚类法 直接聚类法 最短距离聚类法 最远距离聚类法 类平均法等 逐步聚类法 逐步分解法 最优分割法 聚类结果形成的原则 (1)若两个样本(或地点、地区)在已经分好的组中都末出现过,则把它们形成一个独立的新组。 (2)若两个样本或地点、地区中有一个是在已经分好的组中出现过,则把另一个样本或地点也加入到该组中。 (3)若选出一对样本或地点,都分别出现在已经分好的两组中,就把这两组联结在一起。 (4)若选出的一对样本都出现在同—组中,则这—对样本就不用再分组了。 在具体进行分类时,要依这四条原则反复进行,直到把所有样本聚为一类时为止。 (一)直接聚类法 (2)作出聚类过程联结表和聚类谱系图。 根据上述步骤,可以作出聚类过程联结表。 图3.4.1 直接聚类谱系图 (二)最短距离聚类法 直接聚类谱系图 最短距离聚类谱系图 (三)最远距离聚类法 (四)类与类之间距离的定义 计算类之间距离的统一公式: 当α、β、γ三个参数取不同的值时,就形成了不同的聚类方法(见教材表3.4.4),表中,np是p类中单元的个数,nq是q类中单元的个数,nr=np+nq。 五、谱系图的形成 聚类结果,是在相似性统计量的基础上,遵循一定的分类的原则,通过公式计算,以求得各类之间的较为合理的连接、定量分类方法。依此方法所得到的聚类结构图,称为聚类图,或称谱系图或树状图等。 谱系图的特点: 一是可以把无法用平面表达的多维空间中的样本(或变量)之间的相互关系化成二维图形予以表示; 二是分类系统直观,同时还可以定量的方法表达各样本(变量、地区、地点)之间的相似程度。 谱系图形成的步骤 谱系图的手算形成步骤大致可分两步: 第一步,按照聚类过程,将每次聚类的结果,填入联结表中,以便为下一步绘图作好准备; 第二步,根据联结表中的前后顺序即可绘出谱系图。 最短距离法聚类联结表 最短距离聚类谱系图 六、实例分析 例4 下表(参见教材94页)给出了某农业生态经济系统21个区域单元的9项指标数据,运用系统聚类法,对该农业生态经济系统进行聚类分析。 步骤如下: ①用标准差标准化方法,对9项指标的原始数据进行处理; ②采用欧氏距离测度21个区域单元之间的距离; ③选用组平均法,计算类间的距离,依据不同的聚类标准(距离),对各样本(区域单元)进行聚类,并作出聚类谱系图。 练习题:下表是某地区6个分区的自然环境特征的欧氏距离矩阵,是运用最短距离法和最远距离法写出聚类过程,并作出聚类联结表和聚类谱系图。 ④在所得的6×6阶距离矩阵中,非对角元素中最小者为d6,11=1.07,故将G6与G11归并为一类,记为G13,即G13={G6,G11}={G6,(G5,G7)}。再按照公式(3.4.13)式计算G1,G3,G10,G12与G13之间的距离,得到一个5×5阶距离矩阵: 蛾动乙晕彼仰妓琳贷刀焰贰您胰天狙听狡玩稼憨苏苏阐掐掠兴嗜犬肾饰畏jldl.4jldl.4 ⑤在所得的5×5阶距离矩阵中,非对角线元素中最小者为d3,10=1.20,故将G3与G10归并为一类,记为G14,即G14={G3,G10}={G3,(G4,G9)}。再按照公式(3.4.13)式计算G1,G12,G13与G1

文档评论(0)

16588ww + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档