基于势函数标签传播社区发现算法.docVIP

下载本文档

2
0
约5.6千字
约 9页
2018-07-04 发布于福建
举报
版权申诉

基于势函数标签传播社区发现算法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于势函数标签传播社区发现算法

基于势函数标签传播社区发现算法　　摘要：针对标签传播算法（LPA）存在大量随机性、算法稳定性差的问题，提出了基于数据场势函数的标签传播算法（LPAP）。该算法计算所有节点的势值，搜索势值极值点。初始化时仅赋予势值极值点以标签，迭代过程中根据邻接节点中相同标签节点势值之和更新标签，所有节点标签不再改变时迭代结束。实验结果表明：该算法得到的社区划分方式平均是LPA的4.0%，是平衡传播算法（BPA）的12.9%；信息变化参数平均是LPA的45.1%，是BPA的73.3%。具有更好的稳定性，适用于大型网络的社区发现。　　关键词：社区发现；标签传播算法；数据场；势函数；稳定性　　中图分类号： TP391.1； TP18 　　文献标志码：A 　　Abstract：　　Because of randomness， the robustness of Label Propagation Algorithm （LPA） is severely hampered. To improve the robustness， a LPA based on potential function of data field （LPAP） was proposed. The potential of every node was calculated， and local extreme potential was searched. Only the node with extreme potential was labeled initially， and the label was updated according to the sum potential of its neighbors with equal label during iteration. When there were no nodes changing its label， iteration stopped. The experimental results show that the average distinct community partition of LPAP is 4.0% of that of LPA， 12.9% of that of Balanced Propagation Algorithm （BPA）， and the average Variation of Information （VOI） of LPAP is 45.1% of that of LPA， 73.3% of that of BPA. LPAP is significantly more robust， and is suitable for community detection in large network. 　　Key words： community detection； Label Propagation Algorithm （LPA）； data field； potential function； robustness 　　0引言　　现实网络不仅具有小世界和无标度等特性，还呈现明显的社区结构。社区结构在现实网络中发挥着重要作用，可以用来揭示社会网络中具有相同兴趣、爱好以及社会背景的社会团体，可以用来发现生物系统中功能相关的组织单元，可以用来提高万维网的搜索效率和准确性。因此，各种社区发现算法不断地被提了出来。典型的算法包括递归去除连接边的分裂算法[1]、重复地合并小部分的聚合算法[2-3]以及极值优化的模块度算法[4-7]等。　　由于算法时间复杂度原因，只有少数算法适合大型现实网络。Raghavan等[8]提出了标签传播算法（Label Propagation Algorithm， LPA）。初始时每个节点被赋予唯一的数字标签，迭代过程中选择邻接节点标签出现频率最高的标签来更新当前节点的标签。经过几次迭代，密集连接的节点拥有相同的标签，形成一个社区。近年来，标签传播算法又被不断地改进提高。Barber等[9]为了避免LPA中所有节点划分到同一社区，提出了一种模块化标签传播算法；Liu等[10]将模块化标签传播算法与多步贪婪凝聚算法融合，能够避免陷入局部极大值，更加准确识别社区；Leung等[11]采用启发式方法提高算法性能，通过简单参数调整使算法适应于不同规模网络。　　尽管取得了一定的改进，LPA的一个重要问题还没有很好的解决。由于更新顺序是随机的、邻接节点标签频率相同时标签选择也是随机的，算法的鲁棒性受到严重损坏，社区结构的稳定性也就受到严重损伤。为了得到稳定的社区结构，Kato等[12]通过整合多种网络结构信息，降低不相干网络结构的重要性，来提