多维有序样本的聚类方法研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多维有序样本的聚类方法研究 严广松 。.路允芳 (1.河南工程学院 信息工程系,郑州 450007;2.东华大学 纺织学院,上海 200051) 摘 要:聚类分析是常用的多元统计方法.但是对于多维有序样本的聚类较少见。在考虑多个指标 的经济年代划分问题中。需要使用多维的聚类方法,而目前统计软件中大部分没有这种方法。文章提出 了两种解决此类问题的统计方法。这些方法都是在原有的统计聚类方法的基础上得到的,在一般的统计 软件上易于实现,分类的效果良好。 关键词:实多维;有序样本;系统聚类;逐步分类 中图分类号:O212 文献标识码:A 文章编号:1002—6487(2o08)o4一o029—02 i≤n,p1)。要求对这一样本进行分类,其中每一类必须呈 0 引言 {x,,x …,xi}的形式。Fisher聚类的主要算法是建立一个损 失函数。在这个损失函数意义下求得最优解。 聚类分析是一种广泛应用的多元统计分析方法。聚类分 首先是要定义类的直径,用D(i,j)表示类{x;,x ,…,xj} 析的主要思想是通过计算样品之间的距离或者相似度构建 的直径。类直径的定义有很多种,可以根据具体情况来给定。 样品之间的关系树.从而利用阀值的选定确定样品分类数和 用b 表示样品分成k类的一种分法。可以写成: . 样品归属的类别。主要的聚类方法有系统聚类法、分解法、动 b :{i1=l,i1+1,…,i2-1},{i2=1,i2+1,…,i3-1j,…, ,ik+1, 态聚类法、k均值法等等。有序样品的聚类问题是指在实际 … ,n}其中i1=1i2…ikn。 问题中要求分类要排成一定的顺序。如按照时间的先后、地 分类的损失函数为: 层的深浅等,分类时不能打乱这种次序。 k L(b : D(ij, 广1) (1) 目前主要的有序样品聚类方法中以Fisher发展的一种 J=1 方法最为流行。Fisher关于有序样品聚类的基本思想是定义 其中l’k+1-l=n。也就是说,分类应该使得所有的k个类直 类的直径,在分类必须相邻的限制条件下定义了损失函数, 径的和最小。Fisher方法的计算主要是依赖两个递推公式: 在逐步递推的计算中寻找到使得损失函数最小的最优分类。 L(b )=rain fD(1,j_1)+D0,n)}l (2) . 但是目前对有序样品聚类方法的应用只是限于一维样品中. z毛J每n )= mi n {L(bn-1 ) ,“)} (3) 对于多

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档