- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
R语言聚类分析
聚类函数
r 语言中使用 hclust(d, method = complete, members=NULL) 来进行层次聚类
method 表示类的合并方法,有:
si ngle
最短距离法
complete
最长距离法
media n
中间距离法
mcquitty
相似法
average
类平均法
cen troid
重心法
ward
离差平方和法
聚类分析过程
数据的聚类分析,首先要进行数据的标准化, 消除量纲的影响,才能得到准确的聚类分
析结果。
1、数据标准化
数据的标准化(normalization )是将数据按比例缩放,使之落入一个小的特定区间。在 某些比较和评价的指标处理中经常会用到, 去除数据的单位限制,将其转化为无量纲的纯数
值,便于不同单位或量级的指标能够进行比较和加权。
也叫离差标准化,是对原始数据的线性变换,使结果落到 [0,1]区间,转换函数如下:
1 — ruin
j; =
max - min
其中max为样本数据的最大值,min为样本数据的最小值。这种方法有一个缺陷就是当
有新数据加入时,可能导致 max和min的变化,需要重新定义。
log函数转换」
通过以10为底的log函数转换的方法同样可以实现归一下,具体方法如下:
看了下网上很多介绍都是 x*=logl0(x),其实是有问题的,这个结果并非一定落到 [0,1]
区间上,应该还要除以logi0(max),max为样本数据最大值,并且所有的数据都要大于等于
1。
atan函数转换
用反正切函数也可以实现数据的归一化:
x~ =打打12/r
使用这个方法需要注意的是如果想映射的区间为 [0,1],则数据都应该大于等于 0,小于
0的数据将被映射到[-1,0]区间上。
而并非所有数据标准化的结果都映射到 [0,1]区间上,其中最常见的标准化方法就是 Z
标准化,也是SPSS中最为常用的标准化方法:
z-score 标准化(zero-mean normalization)
也叫标准差标准化,经过处理的数据符合标准正态分布,即均值为 0,标准差为1,其
转化函数为:
Lr
a
其中卩为所有样本数据的均值, b为所有样本数据的标准差。
2、聚类分析实例
对新疆地区进行聚类分析:
place
height
waterfall
i cesoildepth
Wn dday
哈巴河
532.6
173.8
15C
61.8
阿勒泰
735.1
191.5
146
37.7
克拉玛
依
427
114.4
197
75.4
巴楚
1116.5
41.6
64
7.6
莎车
1231.2
42.5
93
11
于田
1427
46.4
81
1.4
xinj-read.csv(xinjia ng.csv,header = TRUE)
fun - function(x) (x-min(x))/(max(x)-min(x))
xj3 - apply(xinj[,2:5], 2, FUN=fun) # use method min-max xj3-data.frame(xinj[,1],xj3)
hc.si ngle=hclust(dist(xj3[2:5]),method = si ngle) # 最短距离法聚类
plot(hc.si ngle,ma in = Si ngle Lin kage,xlab=,labels=xj3$xinj...1.,ylab=,sub
place,cex=.9) # 制作聚类图
聚类结果如下图所示:
Single Linkage
吕
吕lo-r-豎
您可能关注的文档
- primer3在线引物设计攻略.docx
- pro,hd电影效果创作实践大学生实践报告3000字.docx
- pp模块的主要功能及标准业务流程.docx
- proe中旋转混合解析.docx
- proe实例教程(洗发水瓶).docx
- proe中各种各样的折弯.docx
- proe-钣金-操作范例.docx
- proe教程(0曲面曲率).docx
- proe实例教程(灯罩).docx
- proe软件认证考试题库_答案.docx
- 小说阅读答题模板・每日10分钟背诵小纸条.docx
- 【絮语文】2025-2026学年上期高三语文早读材料第13周.docx
- 福建省福州市福九联盟2025-2026学年高二上学期11月期中考试语文试题.docx
- 2026《人民日报》闪光金句+精彩作文构思).docx
- 河北省沧州市盐山中学2025-2026学年高一上学期11月期中考试语文试题.docx
- 【絮语文】(公众号)2026高二语文选择性必修中册《屈原列传》优质课一等奖课件.pptx
- 2026届安徽省皖豫名校联盟高三10月调研考试“格物致知””主题作文导写讲评课件.pptx
- 浅谈如何对联.docx
- 民国对联三百副(3).doc
- 渔洋十二法之11.doc
原创力文档


文档评论(0)