- 14
- 0
- 约2.54千字
- 约 8页
- 2017-04-11 发布于河北
- 举报
关于R软件在系统聚类分析中的应用
关于R软件在系统聚类分析中的应用
欢迎来到xx站,今天本网站为大家提供了R软件在系统聚类分析中的应用,希望朋友们读后有所收获!
引言
多元统计分析是统计学的一个重要分支,也称多变量统计分析;在现实生活中,受多种指标共同作用和影响的现象大量存在,多元统计分析就是研究多个随机变量之间相互依赖关系及其内在统计规律的重要学科,其中最常用聚类分析方法,由于多元统计聚类分析方法一般涉及复杂的数学理论,一般无法用手工计算,必须有计算机和统计软件的支持。
在统计软件方面,常用的统计软件有SPSS、SAS、STAT、R、S-PLUS,等等。R软件是一个自由、免费、开源的软件,是一个具有强大统计分析功能和优秀统计制图功能的统计软件,现已是国内外众多统计学者喜爱的数据分析工具。本文结合实例介绍R软件在多元统计聚类分析中的应用。
一、系统聚类分析
聚类分析又称群分析,它是研究(样品或指标)分类问题的一种多元统计方法,所谓类,通俗地说,就是指相似元素的集合。在社会经济领域中存在着大量分类问题,比如若对某些大城市的物价指数进行考察,而物价指数很多,有农用生产物价指数、服务项目价指数、食品消费物价指数、建材零售价格指数等等。由于要考察的物价指数很多,通常先对这些物价指数进行分类。总之,需要分类的问题很多,因此聚类分析这个有用的工具越来越受到人们的重视,它在许多领域中都得到了广泛的应用。
聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等;最常用最成功的聚类分析为系统聚类法,系统聚类法的基本思想为先将n个样品各自看成一类,然后规定样品之间的“距离”和类与类之间的距离。选择距离最近的两类合并成一个新类,计算新类和其他类(各当前类)的距离,再将距离最近的两类合并。这样,每次合并减少一类,直至所有的样品都归成一类为止。
系统聚类法的基本步骤:
1、计算n个样品两两间的距离。
2、构造n个类,每个类只包含一个样品。
3、合并距离最近的两类为一新类。
4、计算新类与各当前类的距离。
5、重复步骤3、4,合并距离最近的两类为新类,直到所有的类并为一类为止。
6、画聚类谱系图。
7、决定类的个数和类。
系统聚类方法:1、最短距离法;2、最长距离法;3、中间距离法;4、重心法;5、类平均法;6、离差平方和法(Ward法)。
二、基于R语言的系统聚类分析程序
R软件及其相关包提供了各种聚类方法,主要是系统聚类方法、快速聚类方法、模糊聚类方法,常用的是系统聚类方法。
R软件实现系统聚类的程序如下:
hclust(d,method=quot;completequot;,members=NULL)
其中,d是由“dist”构成的距离结构,具体包括绝对值距离、欧氏距离、切比雪夫距离、马氏距离、兰氏距离等,默认为欧氏距离;method包括类平均法average、重心法centroid、中间距离法median、最长距离法complete、最短距离法single、离差平方和法ward等,默认是最长距离法complete。
三、应用举例
表1是山东省2008年各市居民家庭平均每人全年消费性支出,利用所给数据对各市进行系统聚类。(表1)
R语言程序如下:
gt;Xlt;-read.delim(quot;clipboardquot;,header=T)
gt;row.names(X)lt;-c(quot;济南quot;,quot;青岛quot;,quot;淄博quot;,quot;枣庄quot;,quot;东营quot;,quot;烟台quot;,quot;潍坊quot;,quot;济宁quot;,quot;泰安quot;,quot;威海quot;,quot;日照quot;,quot;莱芜quot;,quot;临沂quot;,quot;德州quot;,quot;聊城quot;,quot;滨州quot;,quot;菏泽quot;)
gt;dlt;-dist(scale(X)) gt;hc1lt;-hclust(d,quot;singlequot;)#最短距离法
gt;hc2lt;-hclust(d,quot;completequot;)#最长距离法
gt;hc3lt;-hclust(d,quot;medianquot;)#中间距离法
gt;hc4lt;-hclust(d,quot;wardquot;)#Ward法
gt;oparlt;-par(mfrow=c(2,2))
gt;plot(hc1,h
您可能关注的文档
最近下载
- 江南大学大二化学专业分析化学试卷及答案12 (3).doc VIP
- sew mdx61b_变频器说明书(1).doc VIP
- 江南大学大二化学专业分析化学试卷及答案.docx VIP
- SEW MDX61B_变频器说明书.pdf VIP
- 建筑工程施工索赔试题.docx
- 数字智慧方案中国康养产业链图谱研究报告.pptx VIP
- 湖北民族大学大二化学专业分析化学试卷及答案 (2).doc VIP
- 党员2025年度组织生活会“(对照贯彻党的创新理论方面,对照加强党性锤炼方面,对照联系服务群众方面,对照发挥先锋模范作用方面,对照改作风树新风方面)五个对照”对照检查材料.docx VIP
- 2025-2026 学年上学期六年级道德与法治(人教版)期末质量检测试卷(附答案).docx VIP
- 津津有味·读经典Level3《海底两万里》译文和答案.pdf
原创力文档

文档评论(0)