人工智能ArtficialIntelligence(AI).pptVIP

  • 13
  • 0
  • 约2.67千字
  • 约 61页
  • 2018-06-01 发布于江苏
  • 举报
人工智能ArtficialIntelligence(AI)

① 随机选取代表点 将全部样本随机地分成 k 个类,计算每一个类的均值,并把它当作每一个类的代表点 1 2 3 代表点的常用选择方法: ②选择集合中的前 k 个样本 选择集合中排在最前面的 k 个样本作为代表点 分派样本到各个类别的常用方法: 最简单的就近原则:选定代表点后,其余的各点离哪个代表点最近就归入那一类,从而得到初始分类结果 初始划分往往会影响迭代的结果,使我们得到的是局部最优解而不是全局最优解 说明 聚类准则函数 C均值算法的具体步骤 输入:样本数据集 S ,类别数 k 输出:k 个类的划分 步骤: (1) 将样本集合划分成 k 个初始聚类 C1,…,Ck,其均值向量为 M1,…,Mk,并计算准则函数 f (2) 选择下一个备选对象 Y,设其属于聚类 i (3) 若 Ni = 1,则转向步骤(7) ,否则继续 (4) 计算 (5) 对于所有的 j = 1, 2, …, k ,找出 如果 m = i ,则转向步骤(7);否则,将 Y 从 聚类 i 移动聚类 m 中 (6) 重新计算 Mi 和 Mm ,并修改 f (7) 如所有样本计算一次仍不改变 f 的值,则算法结束,否则转向步骤(2) 说明:在实际使用中,还可以选用其他距离形式 C均值算法的缺点 C均值聚类算法的类别数是事先固定 距离对聚类结果有非常大的影响 初始划分影响聚类结果,有可能只找到局部最

文档评论(0)

1亿VIP精品文档

相关文档