5.聚类newnew120160331答辩.ppt

  1. 1、本文档共124页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* (a)空间的群点 (b) 任取两个聚核 (c) 第一次分类 (d) 求各类中心 * (e) 第二次分类 * 二、选择凝聚点和确定初始分类 凝聚点就是一批有代表性的点,是欲形成类的中心。凝聚点的 选择直接决定初始分类,对分类结果也有很大的影响,由于凝聚点 的不同选择,其最终分类结果也将出现不同。故选择时要慎重.通 常选择凝聚点的方法有: (1) 人为选择,当人们对所欲分类的问题有一定了解时,根据经验,预先确定分类个数和初始分类,并从每一类中选择一个有代表性的样品作为凝聚点。 (2) 将数据人为地分为A类,计算每一类的重心,就将这些重心作为凝聚点。 * (3) 用密度法选择凝聚点。以某个正数d为半径,以每个样品为球心,落在这个球内的样品数(不包括作为球心的样品)就叫做这个样品的密度。计算所有样品点的密度后,首先选择密度最大的样品作为第一凝聚点,并且人为地确定一个正数D(一般D> d,常取D=2d)。然后选出次大密度的样品点,若它与第一个凝 聚点的距离大于D,则将其作为第二个凝聚点;否则舍去这点,再 选密度次于它的样品。这样,按密度大小依次考查,直至全部样品考查完毕为止.此方法中,d要给的合适,太大了使凝聚点个数太 少,太小了使凝聚点个数太多。 * (5) 随机地选择,如果对样品的性质毫无所知,可采用随机数表来选择,打算分几类就选几个凝聚点。或者就用前A个样品作为凝聚点(假设分A类)。这方法一般不提倡使用。 (4) 人为地选择一正数d,首先以所有样品的均值作为第一凝聚点。然后依次考察每个样品,若某样品与已选定的凝聚点的距 离均大于d,该样品作为新的凝聚点,否则考察下一个样品。 * 五、动态聚类步骤为: 第一,选择若干个观测值点为“凝聚点”; 第二,可选择地,通过分配每个“凝聚点”最近的类里来形成临时分类。每一次对一个观测值点进行归类,“凝聚点”更新为这一类目前的均值; * 第三,可选择地,通过分配每个“凝聚点”最近的类里来形成临时分类。所有的观测值点分配完后,这些类的“凝聚点”用临时类的均值代替。该步骤可以一直进行直到“凝聚点”的改变很小或为零时止; 第四,最终的分类有分配每一个观测到最近的“凝聚点”而形成。 * 三、衡量聚类结果的合理性指标和算法终止的标准 定义 设 表示在第n次聚类后得到的第i类集合, , 为第n次聚类所得到的聚核。 定义 若分类不合理时, 会很大,随着分类的过程,逐渐下降,并趋于稳定。 * 定义 第i类中所有元素与其重心的距离的平方和: ?是事前给定的一个充分小量 。 为所有K个类中所有元素与其重心的距离的平方和。 定义算法终止的标准是 * 五、动态聚类步骤为: 第一,选择若干个观测值点为“凝聚点”; 第二,可选择地,通过分配每个“凝聚点”最近的类里来形成临时分类。每一次对一个观测值点进行归类,“凝聚点”更新为这一类目前的均值; * 第三,可选择地,通过分配每个“凝聚点”最近的类里来形成临时分类。所有的观测值点分配完后,这些类的“凝聚点”用临时类的均值代替。该步骤可以一直进行直到“凝聚点”的改变很小或为零时止; 第四,最终的分类有分配每一个观测到最近的“凝聚点”而形成。 * 例 我国经济发展的总目标是到2000年人民生活达到小康标准,因此,了解各地区目前对小康生活质量的实现程度。对各地区实现小康生活质量的状况进行综合评价,对各级政府部门具有重要意义。数据是1990年全国30个省在经济(jj)、教育(jy)、健康(jk)和居住环境(jz)四个方面对小康标准已经实现的程度,1表示已经达到或超过小康水平,0表示低于或多或少刚达到温饱水平。希望利用该数据对15个地区进行分类研究。 * ? jj jy jk jz 类别 距离 beijngsh 0.7258 0.9413 1.0000 0.5000 1 0.29550 anghai 0.5346 0.9848 1.0000 0.5000 1 0.14909 ianjin 0.3246 0.9733 1.0000 0.5000 1 0.16173 henna 0.2301 0.4621 1.0000 1.0000

您可能关注的文档

文档评论(0)

***** + 关注
实名认证
内容提供者

我是自由职业者,从事文档的创作工作。

1亿VIP精品文档

相关文档