多维有序样本的聚类方法研究.pdfVIP

下载本文档

81
0
约7.72千字
约 2页
2017-07-28 发布于北京
举报
版权申诉

多维有序样本的聚类方法研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

多维有序样本的聚类方法研究严广松。．路允芳 (1．河南工程学院信息工程系，郑州 450007；2．东华大学纺织学院，上海 200051) 摘要：聚类分析是常用的多元统计方法．但是对于多维有序样本的聚类较少见。在考虑多个指标的经济年代划分问题中。需要使用多维的聚类方法，而目前统计软件中大部分没有这种方法。文章提出了两种解决此类问题的统计方法。这些方法都是在原有的统计聚类方法的基础上得到的，在一般的统计软件上易于实现，分类的效果良好。关键词：实多维；有序样本；系统聚类；逐步分类中图分类号：O212 文献标识码：A 文章编号：1002—6487(2o08)o4一o029—02 i≤n，p1)。要求对这一样本进行分类，其中每一类必须呈 0 引言 {x，，x …，xi}的形式。Fisher聚类的主要算法是建立一个损失函数。在这个损失函数意义下求得最优解。聚类分析是一种广泛应用的多元统计分析方法。聚类分首先是要定义类的直径，用D(i，j)表示类{x；，x ，…，xj} 析的主要思想是通过计算样品之间的距离或者相似度构建的直径。类直径的定义有很多种，可以根据具体情况来给定。样品之间的关系树．从而利用阀值的选定确定样品分类数和用b 表示样品分成k类的一种分法。可以写成：．样品归属的类别。主要的聚类方法有系统聚类法、分解法、动 b ：{i1=l，i1+1，…，i2-1}，{i2=1，i2+1，…，i3-1j，…，，ik+1，态聚类法、k均值法等等。有序样品的聚类问题是指在实际 … ，n}其中i1=1i2…ikn。问题中要求分类要排成一定的顺序。如按照时间的先后、地分类的损失函数为：层的深浅等，分类时不能打乱这种次序。 k L(b ： D(ij，广1) (1) 目前主要的有序样品聚类方法中以Fisher发展的一种 J=1 方法最为流行。Fisher关于有序样品聚类的基本思想是定义其中l’k+1-l=n。也就是说，分类应该使得所有的k个类直类的直径，在分类必须相邻的限制条件下定义了损失函数，径的和最小。Fisher方法的计算主要是依赖两个递推公式：在逐步递推的计算中寻找到使得损失函数最小的最优分类。 L(b )=rain fD(1，j_1)+D0，n)}l (2) ．但是目前对有序样品聚类方法的应用只是限于一维样品中． z毛J每n )= mi n {L(bn-1 ) ，“)} (3) 对于多