r语言聚类分析实例教程.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
R语言聚类分析 聚类函数 r 语言中使用 hclust(d, method = complete, members=NULL) 来进行层次聚类 method 表示类的合并方法,有: si ngle 最短距离法 complete 最长距离法 media n 中间距离法 mcquitty 相似法 average 类平均法 cen troid 重心法 ward 离差平方和法 聚类分析过程 数据的聚类分析,首先要进行数据的标准化, 消除量纲的影响,才能得到准确的聚类分 析结果。 1、数据标准化 数据的标准化(normalization )是将数据按比例缩放,使之落入一个小的特定区间。在 某些比较和评价的指标处理中经常会用到, 去除数据的单位限制,将其转化为无量纲的纯数 值,便于不同单位或量级的指标能够进行比较和加权。 也叫离差标准化,是对原始数据的线性变换,使结果落到 [0,1]区间,转换函数如下: 1 — ruin j; = max - min 其中max为样本数据的最大值,min为样本数据的最小值。这种方法有一个缺陷就是当 有新数据加入时,可能导致 max和min的变化,需要重新定义。 log函数转换」 通过以10为底的log函数转换的方法同样可以实现归一下,具体方法如下: 看了下网上很多介绍都是 x*=logl0(x),其实是有问题的,这个结果并非一定落到 [0,1] 区间上,应该还要除以logi0(max),max为样本数据最大值,并且所有的数据都要大于等于 1。 atan函数转换 用反正切函数也可以实现数据的归一化: x~ =打打12/r 使用这个方法需要注意的是如果想映射的区间为 [0,1],则数据都应该大于等于 0,小于 0的数据将被映射到[-1,0]区间上。 而并非所有数据标准化的结果都映射到 [0,1]区间上,其中最常见的标准化方法就是 Z 标准化,也是SPSS中最为常用的标准化方法: z-score 标准化(zero-mean normalization) 也叫标准差标准化,经过处理的数据符合标准正态分布,即均值为 0,标准差为1,其 转化函数为: Lr a 其中卩为所有样本数据的均值, b为所有样本数据的标准差。 2、聚类分析实例 对新疆地区进行聚类分析: place height waterfall i cesoildepth Wn dday 哈巴河 532.6 173.8 15C 61.8 阿勒泰 735.1 191.5 146 37.7 克拉玛 依 427 114.4 197 75.4 巴楚 1116.5 41.6 64 7.6 莎车 1231.2 42.5 93 11 于田 1427 46.4 81 1.4 xinj-read.csv(xinjia ng.csv,header = TRUE) fun - function(x) (x-min(x))/(max(x)-min(x)) xj3 - apply(xinj[,2:5], 2, FUN=fun) # use method min-max xj3-data.frame(xinj[,1],xj3) hc.si ngle=hclust(dist(xj3[2:5]),method = si ngle) # 最短距离法聚类 plot(hc.si ngle,ma in = Si ngle Lin kage,xlab=,labels=xj3$xinj...1.,ylab=,sub place,cex=.9) # 制作聚类图 聚类结果如下图所示: Single Linkage 吕 吕lo-r-豎

文档评论(0)

wumanduo11 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档