- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
算法:
第一步:输入N个模式样本 xi, i 1, 2, …, N
预选Nc个初始聚类中心,它可以不等于所要求的聚类中心的数目,其初始位置可以从样本中任意选取。
预选:K 预期的聚类中心数目;
θN 每一聚类域中最少的样本数目,若少于此数即不作为一个独立的聚类;
θS 一个聚类域中样本距离分布的标准差;
θc 两个聚类中心间的最小距离,若小于此数,两个聚类需进行合并;
L 在一次迭代运算中可以合并的聚类中心的最多对数;
I 迭代运算的次数。
第二步:将N个模式样本分给最近的聚类Sj,假若,即||x-zj||的距离最小,则。
第三步:如果Sj中的样本数目Sj θN,则取消该样本子集,此时Nc减去1。
(以上各步对应基本步骤(1))
第四步:修正各聚类中心
第五步:计算各聚类域Sj中模式样本与各聚类中心间的平均距离
第六步:计算全部模式样本和其对应聚类中心的总平均距离
(以上各步对应基本步骤(2))
第七步:判别分裂、合并及迭代运算
若迭代运算次数已达到I次,即最后一次迭代,则置θc 0,转至第十一步。
若,即聚类中心的数目小于或等于规定值的一半,则转至第八步,对已有聚类进行分裂处理。
若迭代运算的次数是偶数次,或,不进行分裂处理,转至第十一步;否则(即既不是偶数次迭代,又不满足),转至第八步,进行分裂处理。
(以上对应基本步骤(3))
第八步:计算每个聚类中样本距离的标准差向量
其中向量的各个分量为
式中,i 1, 2, …, n为样本特征向量的维数,j 1, 2, …, Nc为聚类数,Nj为Sj中的样本个数。
第九步:求每一标准差向量 σj, j 1, 2, …, Nc 中的最大分量,以 σjmax, j 1, 2, …, Nc 代表。
第十步:在任一最大分量集 σjmax, j 1, 2, …, Nc 中,若有σjmax θS ,同时又满足如下两个条件之一:
和Nj 2 θN + 1 ,即Sj中样本总数超过规定值一倍以上,
则将zj 分裂为两个新的聚类中心和,且Nc加1。 中对应于σjmax的分量加上kσjmax,其中;中对应于σjmax的分量减去kσjmax。
如果本步骤完成了分裂运算,则转至第二步,否则继续。
(以上对应基本步骤(4)进行分裂处理)
第十一步:计算全部聚类中心的距离
Dij || zi - zj ||,i 1, 2, …, Nc-1 ,j i+1, …, Nc。
第十二步:比较Dij 与θc 的值,将Dij θc 的值按最小距离次序递增排列,即
式中,。
第十三步:将距离为的两个聚类中心和合并,得新的中心为:
,k 1, 2, …, L
式中,被合并的两个聚类中心向量分别以其聚类域内的样本数加权,使为真正的平均向量。
(以上对应基本步骤(5)进行合并处理)
第十四步:如果是最后一次迭代运算(即第I次),则算法结束;否则,若需要操作者改变输入参数,转至第一步;若输入参数不变,转至第二步。
在本步运算中,迭代运算的次数每次应加1。
[算法结束]
文档评论(0)