第四章聚类分析剖析.pptx

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章聚类分析剖析

第四章 聚类分析;聚类分析与判别分析的区别 判别分析:事先已知研究对象可以分成哪几种类别。需要拥有一批事先已经知道类别的历史样本,参考这些样本建立判别函数,对某一新的样品,判断其分类。 聚类分析:事先不知道研究对象可以分成哪些类别。聚类分析要做的就是根据数学方法定量地确定这些样品之间的亲疏关系,按照相似程度来对他们进行分类。 聚类分析举例: 例如,对一批环流形势图根据它们的相似程度进行分类(这些环流形势图所造成的预报量的结果相同或未知,因此无法通过预报量对其进行分类,只能根据这些图像的相似程度来划分它们的类别,这就是聚类分析的内容)。;第四章1 相似性的度量;距离系数;(2)欧氏距离 X矩阵中两列向量xi和xj的差向量各元素的平方和的平方根。;例:已知二维正态总体G的分布为:G ~ N ( μ, V), 并且: ;图解马氏距离与欧氏距离的区别;相似性的度量;第四章2 系统聚类法;最短距离法;n个样品的最短距离聚类法的步骤: (任选一种距离,如“欧氏距离”,作为两个样品之间的距离):;“最短距离法”聚类举例 (P114 例1);最短距离法 聚类图;最长距离法;离差平方和法;对于第g类的资料阵(m行ng列,从X中抽取ng列),可以写为Xg :;把n个样品分成k类,分法非常多,要比较所有的分法使得S最小,不太现实。 因此,只好放弃在一切分类中寻求S的极小值,提出使S达到局部极小的办法。;“离差平方和”聚类法举例;2. D(1)中G3与G4的距离最小,将G3与G4合并成G10, 目前共有三类: G7{x1,x2}, G8{x5,x6}, G10{x3,x4} 然后计算两两之间的距离阵D(2)如右图所示:;第四章3 动态聚类法;K-均值(K-means)聚类: 固定类别的数目为k类,所以也可称为“定K-均值聚类”。;P118例3,有一组4个指标10次观测的样本数据,并已标准化(表4.6),试用定K-均值法进行聚类,把10个样品分成5类。;3. 根据样品之间最小距离的原则,对样品进行归类,;5. 把各类别的均值列向量作为新的凝聚点(初始分类),重复以上2、3步步骤,进行新的分类。;5.3 计算各类的重心(均值向量),以便作为新的凝聚点:;动K-均值聚类;动K-均值聚类的步骤:

您可能关注的文档

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档