- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ISODATA算法原理步骤 ⑸ 依据 、 判断停止、分裂或合并。 ① 若迭代次数 已达 ,则置 转到⑼;否则转下。 若 则转到⑹(将一些类分裂);否则转下。 若 ,(则跳过分裂处理)转至⑼,否则转下。 若 ,当迭代次数 是奇数时转至⑹(分裂处理);迭代次数 是偶数时转至⑼(合并处理)。 ISODATA算法原理步骤 ⑹ 计算各类类内距离的标准差矢量 式中, 为分量编号, 为类的编号, 为矢量维数,是 的第 个分量, 是 的第 个分量。 ⑺ 对每一聚类,求出类内距离标准差矢量 中的最大分量 ⑻ 在 中,对任一 ,若有 ,同时又满足下面两个条件之一: ① 和 ② 则将该类 分裂为两个聚类,且令 。这两个新类的中心 和 是这样构成的: 和 只是在 中相应于 的分量分别加上和减去 ,而其它分量不变,其中 ,k的选取应使 和 仍在 的类域空间中且其它类 的模式到 和 距离较远,而原 类中的模式和它们距离较小。分裂后, ,转至⑵;否则,转下。 ISODATA算法原理步骤 ⑼ 计算各对聚类中心间的距离 ⑽ 依据 判断合并。将 与 比较,并将小于 的那些 按递增次序排列,取前L个, 。从最小的 开始,将相应的两类合并。若原来的两个类心为 和 ,则合并后的聚类中心为 (已并掉的类数)。在一次迭代中,某一类最多只能被合并一次。 ISODATA算法原理步骤 ⑾ 如果迭代次数 已达 次或过程收敛,则结束。否则, ,若需要调整参数,则转至⑴;若不改变参数,则转至⑵。 ISODATA算法原理步骤 我们将ISODATA算法的合并和分裂的条件归纳如下: 合并的条件: (类内样本数 )∨(类的数目 )∧(两类间中心距离 ) 分裂的条件: (类的数目 )∧(类的某分量标准差 )∧ 这里,∨表示“或”的关系;∧表示“与”的关系。如果类的 数目 有 ,当 是奇数时分裂,当 是偶数时合并。 由上述合并与分裂的判断条件可以看出算法初设的7个参数存 在一定的相互制约。 ISODATA算法总结 (二维) (1)初始值设定: 类间距离上限 距离标准差上界 最少模式数目 合并的类的最多对数 ISODATA算法举例 (2)聚类(只有一个中心): ISODATA算法举例 (4) 计算聚类中心、类内平均距离和总的平均距离。 (3)因 ,无合并: ISODATA算法举例 (5)因不是最后一步迭代,且 ,转至⑹ (6)求 的标准差矢量 ISODATA算法举例 (6) 因 且 将 分裂成 两类,取 , 则 (7)算得 且 转(2) ISODATA算法举例 (2)聚类(两个中心): (3) 因 ,无合并: ISODATA算法举例 (4) 计算聚类中心、类内平均距离和总的平均距离。 (5) 因这是偶次迭代,满足算法原理步骤⑸中 ④的条件,故转⑼ ISODATA算法举例 (9)计算类间距离 由 ,类不能合并。 (11) 因不是最后一 次迭代( ,题设 ), ,判断是否修改参数。由上面结果可知,已获得所要求类别数目,类间距离大于类内距离,每类样本数都有样本总数的足够大的百分比,因此不改变参数。 ISODATA算法举例 (2)~(4) 计算结果与前一次迭代结果相同。 (5) 没有任一种情况被满足,到⑹。 (6) 计算 和 的标准差矢量 (7) ,分裂条件不满足,转至⑼。 与前一次迭代结果相同, 无合并发生。 ,无新的变化, ,转至⑵。 ⑵~⑷ 与前一次迭代结果相同。 ⑸ 因是最后一次迭代,令 ,转至⑼。 ⑼ ,同前。 ⑽ 因 ,无合并发生。 ⑾ 因是最后一次迭代, 结束。 * 小结 简单聚类: 层次聚类: 动态聚类:C-均值、ISOTDATA * 上机 层次聚类 * * 预期的类数, =初始聚类中
文档评论(0)