面向网络结构发现的批量主动学习算法.pdf

面向网络结构发现的批量主动学习算法.pdf

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘 要 随着信息化时代的迅速发展,大量在线社交网络平台随之产生,如 Friendster 、 Myspace 、Bebo 、Facebook 、微博以及贴吧等等,发现这些网络的聚类结构及交互规律 已成为当前的研究热点之一。研究者提出大量无监督的网络聚类结构发现方法,但其 聚类准确率不高。而半监督网络聚类能够利用先验信息提高网络聚类准确率,但其依 赖于先验信息的质量。主动学习可以选择高质量的网络节点进行标记,其不仅保证了 先验信息的质量,而且保证了用较少先验获得最大聚类性能提升。因此,面向网络结 构发现的主动学习具有重要的研究价值。 目前有一些研究者提出了一些用于社区发现的主动学习方法,但其选择的网络节 点对具有混合模式的网络结构发现无效。具有混合模式的网络可能不存在社区结构, 或存在其他聚类结构,如二分结构、星型结构以及多种结构的混合等。因此,有必要 面向网络结构发现目标,设计主动学习算法,提高具有多种聚类模式的网络结构发现 性能。 本论文主要完成了以下几方面的研究内容: (1)针对面向属性网络分类的主动学习BMAL(Batch Mode Active Learning)算法, 在只考虑网络节点链接信息的情况下,不能有效选择使网络结构发现性能提升最大的 最优节点集合的问题,提出一种面向网络结构发现的批量主动学习算法 BMAL_NMS(Network with Mixture Structures) 。该算法基于未标记节点的最大不确定 性、最大影响力和最小冗余性三个策略选择最优节点集合。实验结果表明BMAL_NMS 算法能够选择使网络结构发现性能提升最大的节点集合。 (2)针对BMAL_NMS 算法不能充分利用网络节点属性信息的问题,融合网络节点 属性信息和链接信息,提出面向属性网络的批量主动学习算法 BMAL_CLF(Content and Link Fusion) 。该算法采用表示学习将节点属性信息和链接信息表示成节点向量, 然后将节点向量作为算法输入,利用目标函数的子模型迭代选择最优节点集合。实验 结果表明BMAL_CLF 算法优于BMAL_NMS 算法。 (3)将面向属性网络的批量主动学习算法BMAL_CLF 应用于CSDN 用户画像中, 根据用户的各种行为数据与发表的博客内容数据,选择具有代表性的CSDN 用户。并 将选择的用户作为先验信息,运行半监督属性网络结构发现算法。实验结果表明 BMAL_CLF 具有一定的应用价值。 关键字:批量主动学习 网络结构发现 节点集合选择 半监督聚类 I ABSTRACT With the progress of industrialization, urbanization and the rise of new communication technologies, a large number of various online social networking platforms have emerged, such as Friendster, Myspace, Bebo, Facebook, weibo and tieba, etc. It has become one of the current research hotspots to discover the clustering structure and interaction rules of these networks. Researchers have proposed a large number of unsupervised network clustering structure discovery methods, but their clustering accuracy is not high. Semi-supervised network clustering can use prior information to improve the accuracy of network clustering, but it depends on the quality of prior i

文档评论(0)

136****6583 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档