- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
类间距离的计算方法 2008年8月 Nearest neighbor(最短距离法)—用两个类别中各个数据点之间最短的那个距离来表示两个类别之间的距离 Furthest neighbor(最长距离法)—用两个类别中各个数据点之间最长的那个距离来表示两个类别之间的距离 Centroid clustering(重心法)—用两个类别的重心之间的距离来表示两个类别之间的距离 between-groups linkage(组间平均距离法)—SPSS的默认方法。是用两个类别中间各个数据点之间的距离的平均来表示两个类别之间的距离 Ward‘s method(离差平方和法)—使各类别中的离差平方和较小,而不同类别之间的离差平方和较大 绘制谱系图 dendrogram(Z); 形成聚类cluster T = cluster(Z,cutoff,c) T = cluster(Z,maxclust,n) 其他中间过程 squareform(Y) 作用于pdist返回值 dendrogram(Z)作用于linkage返回值 绘制谱系图 [c ,d]= cophenet(Z,Y),同型相关系数 作用于linkage返回值和原始值 inconsistent(Z) 作用于linkage返回值 谱系强度评价 W = inconsistent(Z,3) W = 0.13130 0.00000 1.00000 0.00000 0.13860 0.00000 1.00000 0.00000 0.14630 0.01090 2.00000 0.70710 0.23910 0.00000 1.00000 0.00000 0.19510 0.05680 4.00000 0.94250 0.23080 0.05430 4.00000 0.93200 0.23950 0.07480 4.00000 0.76360 0.26540 0.09450 4.00000 0.92030 0.37690 0.09500 3.00000 1.10400 Mean std Inconsistency coefficient count 一次形成法 IDX = kmeans(X,k) 示例 X = [randn(100,2)+ones(100,2);... randn(100,2)-ones(100,2)]; opts = statset(Display,final); [idx,ctrs] = kmeans(X,2, Distance,city,... Replicates,5, Options,opts); plot(X(idx==1,1),X(idx==1,2),r.,MarkerSize,12) hold on plot(X(idx==2,1),X(idx==2,2),b.,MarkerSize,12) plot(ctrs(:,1),ctrs(:,2),kx, MarkerSize,12,LineWidth,2) plot(ctrs(:,1),ctrs(:,2),ko, MarkerSize,12,LineWidth,2) legend(Cluster 1,Cluster 2,Centroids, Location,NW) 聚类分析 Cluster Analysis 油气计算机综合应用 本章学习目标 掌握地球科学中大量观测数据的样品或变量的数学定量分类思想; 学会样品或变量数据变换和分类标准的数学表示; 数据的聚类:谱系图制作及其地质意义; 学习重点、难点 重点 不同应用目的聚类分析技术的正确选取和聚类分析矩阵的求法以及谱系图的地质意义 难点 实际观测数据的聚类分析矩阵的构建和程序开发,深入理解谱系图的地质意义 问题的提出 地球科学涉及众多的分类问题,如地质学研究中岩石的分类、矿物矿床的分类、古生物的分类。油气勘探、开发过程中,石油成因研究、油藏类型研究、地化资料等的分类与分级。针对上述问题,怎样进行科学分类,分类结果有何启示? 第一节 聚类分析的思想 假设所研究的对象中的元素,存在着不同 程度的相似性(亲疏关系)根据其各观测指。 标,找出一些能够度量样品之间相似程度的统 计量,据此,把一些相似程度大的样品聚为一 类,即关系密切的聚合到一个小的分类单位, 疏远的聚合到一个大的分类单位,直到把所有 样品都聚合完毕,形成一个由小到大的分类系 统,最后把分类系统直观地用图形表示出来。 1.对象分类 根据分类对象的不同,聚类分析分为二 种一种是对指标(即变量)进行分类,。 叫做 R 型聚类分析,另一种是对样品进行分类,叫做 Q 型聚类分析。
文档评论(0)