- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于自适应的半监督近邻传播算法.pdf
福 建 电 脑
U J I A N C O M P U T E R
F
DOI:10.16707/j.cnki.fjpc.2017.05.057
基于自适应的半监督近邻传播算法
王颖慧
(安徽信息工程学院 计算机与软件工程系 安徽 芜湖 241000 )
【摘 要】给定的数据集通常包含部分先验信息,有效利用先验信息可以提高类簇划分的质量。 在近邻传播算法中,
偏向参数对类簇划分起着关键性作用 ,因此通过调整偏向参数的值搜索一个较优的结果是一种可取的方法。 本文给出
的基于自适应的半监督近邻传播算法即是利用先验信息,通过修改偏向参数的值找到一个较优的类簇结果。 实验表明,
该方法在大多数情况下取得较好的聚类结果。
【关键字】自适应;半监督;近邻传播;偏向参数
1 引言 AP 算法的基本流程如下:
近邻传播算法[1] (Affinity Propagation ,简称 AP)是由 Frey 等 (1) 初始化 :根据长度为 N 的数据集 X ;计算 S(i ,k) ,初始化
人 2007 年在《Science》上提出了一种新型的聚类算法 ,该算法 R(i,k)和 A (i ,k)为全 0 矩阵;
是一种无参数的聚类方法 , 即无需给定类簇的个数及其他参 (2) 迭代更新:根据公式 1)-2)对所有数据点求 A 和 R ,找到
数,通过矩阵迭代更新收敛到稳定的类中心,然后将每一个数 每个点的类代表点。
据点划分到相似度最大的类中心 ,该类中心点和归属于它的数 (3) 结束条件 :迭代次数超过规定的最大数目 1000 或者类
据点组成一个类簇。 代表点在连续 100 次迭代中保存不变 ,算法结束,否则转 向 2)
在 AP 算法中, 有两个尚未解决的也是该算法热点研究的 继续执行;
问题:一是如何找到最优偏向参数使该算法能产生最优的聚类 (4) 输出:聚类中心{c ,c ,…,c },k 为类簇个数。
1 2 k
结果;另一个是算法迭代更新过程中可能发生震荡无法收敛影 2.2 半监督
响聚类结果[2-4] 。 针对这些问题,文献[2]通过扫描偏向参数搜索 常见的约束信息包括 must-link 约束和 cannot-link 约束两
聚类个数空间寻找最优聚类结果、 调整阻尼因子来消除震荡; 种,满足 must-link 约束的两个点一定属于同一类簇,通常用集
文献[3]利用有效性指标监督引导聚类方向;文献[4]利用不同 合 M ={(x ,x )}表示;满足 cannot-li
文档评论(0)