- 3
- 0
- 约8.15千字
- 约 71页
- 2017-05-31 发布于湖北
- 举报
选择凝聚点和确定初始分类 凝聚点就是一批有代表性的点,是欲形成类的中心。凝聚点的 选择直接决定初始分类,对分类结果也有很大的影响,由于凝聚点 的不同选择,其最终分类结果也将出现不同。故选择时要慎重.通 常选择凝聚点的方法有: (1) 人为选择,当人们对所欲分类的问题有一定了解时,根据经验,预先确定分类个数和初始分类,并从每一类中选择一个有代表性的样品作为凝聚点。 (2) 重心法 将数据人为地分为A类,计算每一类的重心,将重心作为凝聚点。 (3) 密度法 以某个正数d为半径,以每个样品为球心,落在这个球内的样品数(不包括作为球心的样品)称为这个样品的密度。计算所有样品点的密度后,首先选择密度最大的样品为第一凝聚点。然后选出密度次大的样品点,若它与第一个凝 聚点的距离大于2d ,则将其作为第二个凝聚点;否则舍去这点。这样,按密度由大到小依次考察,直至全部样品考查完毕为止.此方法中,d要给得合适,太大了使凝聚点个数太 少,太小了使凝聚点个数太多。 (4) 人为地选择一正数d,首先以所有样品的均值作为第一凝聚点。然后依次考察每个样品,若某样品与已选定的凝聚点的距 离均大于d,该样品作为新的凝聚点,否则考察下一个样品。 第一,选择凝聚点; 第二,初始分类; 对于取定的凝聚点,视每个凝聚
原创力文档

文档评论(0)