R软件在系统聚类分析中的应用[期刊论文].pdfVIP

  • 6
  • 0
  • 约6.65千字
  • 约 2页
  • 2019-10-11 发布于辽宁
  • 举报

R软件在系统聚类分析中的应用[期刊论文].pdf

R软件在系统聚类分析中的应用 口文 /王怀亮 提要 多元统计聚类方法已被广泛 指数、建材零售价格指数等等。由于要考 1、计算n个样品两两间的距离。 应用于 自然科学和社会科学的各个领域, 察的物价指数很多,通常先对这些物价指 2、构造 13.个类,每个类只包含一个样 而在现实处理多元数据聚类分析中,离不 数进行分类。总之,需要分类的问题很多, 品。 开统计软件的支持;R软件由于其免费、 因此聚类分析这个有用的工具越来越受 3、合并距离最近的两类为一新类。 开源、强大的统计分析及其完美的作图功 到人们的重视,它在许多领域中都得到了 4、计算新类与各当前类的距离。 能已得到越来越多人的关注与应用:本文 广泛的应用。 5、重复步骤3、4,合并距离最近的两 结合实例介绍了R软件在多元统计系统 聚类分析内容非常丰富,有系统聚类 类为新类,直到所有的类并为一类为止。 分析中的应用。 法、有序样品聚类法、动态聚类法、模糊聚 6、画聚类谱系图。 类法、图论聚类法、聚类预报法等;最常用 7、决定类的个数和类。 关键词:R软件;系统聚类分析;多元统计 最成功的聚类分析为系统聚类法,系统聚 系统聚类方法:1、最短距离法:2、最 中图分类号:1:49 文献标识码:A 类法的基本思想为先将n个样 品各 自看 长距离法;3、中间距离法:4、重心法:5、类 引言 成一类,然后规定样品之间的“距离’,和类 平均法;6、离差平方和法(waId法)。 多元统计分析是统计学的一个重要 与类之间的距离。选择距离最近的两类合 二、基于R语言的系统聚类分析程序 分支,也称多变量统计分析;在现实生活 并成一个新类,计算新类和其他类 (各当 R软件及其相关包提供了各种聚类 中,受多种指标共同作用和影响的现象大 前类)的距离,再将距离最近的两类合并。 方法,主要是系统聚类方法、快速聚类方 量存在,多元统计分析就是研究多个随机 这样,每次合并减少一类,直至所有的样 法、模糊聚类方法,常用的是系统聚类方 变量之间相互依赖关系及其内在统计规 品都归成一类为止。 法。 律的重要学科,其中最常用聚类分析方 系统聚类法的基本步骤: R软件实现系统聚类的程序如下: 法,由于多元统计聚类分析方法一般涉及 表1 山东各市居民家庭平均每人全年消费性支出(元 /人) 复杂的数学理论,一般无法用手工计算, 地区 食品 衣着 居住 设备用品 交通通讯 文化教育 医疗保健 其他 必须有计算机和统计软件的支持。 济南 1628.16 252.86 790.11 285.64 634.83 355.54 394.37 43.9 在统计软件方面,常用的统计软件有 青岛 1999.61 523.76 901.56 297.76 595.34 618.12 260.17 106.42 SPSS、SAS、STAT、R、S-PLUS,等等。R软 淄博 1691.6 372.21 844.44 30o.46 494.67 580.6 370.84 102.16 件是一个 自由、免费、开源的软件,是一个 枣庄 1370.59 272.95 614.3 227.52 454.73 245.93 220.88 84.2 具

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档