- 19
- 0
- 约3.72千字
- 约 8页
- 2018-10-15 发布于福建
- 举报
复杂网络中社区识别的研究
复杂网络中社区识别的研究
摘 要: 实证研究表明,复杂网络虽然千差万别,但实际上它们大多拥有许多相似的性质。聚类效应使得网络中存在社区结构。社区识别的目标就是识别复杂网络中的社区结构,以便能更准确地揭示其隐藏结构,为后续的挖掘、分析等活动提供先决条件。首先描述复杂网络研究的国内外现状,其次阐述和介绍复杂网络社区识别方法的分类和应用实例,再次论述目前社区识别方法中存在的主要问题,最后对目前的社区识别方法进行小结和展望。
关键词: 复杂网络;社区识别;综述
0 引言
网络社区识别也经常被称作网络划分。但一般来说,网络社区识别具较之后者具有更丰富的内涵。从目前的文献来看,对于网络社区识别这一概念主要有两种理解:一是指利用某种方法将网络划分成内部联系紧密而相互之间联系稀疏的簇,二是指按照某种要求以人机交互的方式将满足要求的社区找出来。
1 国内外研究现状
国外对复杂网络的研究和应用已涵盖了诸多方面和领域,如犯罪网络、反恐网络、电子商务、疫情监测、作者合作网络、蛋白质相互作用网络、基因常规网络、邮件网络、虚拟学习、作者——主题分析、社区发现、空间文本挖掘、标签系统、虚拟社区、口语处理、角色识别、博客世界、青少年关系网络、社会层次发现、电话通讯网络、推荐系统、大型程序中Bug的预测和发现等。
相比较而言,国内对复杂网络的研究起步较晚。在改革开放之后,我国的复杂网络研究只限于社会科学领域,其与计算机技术相结合也只是近几年的事。国内对复杂网络的研究相对滞后,从深度和广度两方面都与国外的研究水平有着很大的差距,而且大部分研究论文皆属于社会科学和经济管理领域,与计算机科学直接相关的研究所占比例极低,而且大多还停留在初步的理论探讨或简单应用。
2 社区识别方法分类及应用实例
2.1 社区识别方法分类
社区识别方法大致可以分为两大类。一类是基于图形分割的识别方法,一类是基于相似度聚类的识别方法。
在第一类中,比较有影响的识别方法有Kernighan-Lin方法、基于拉普拉斯图特征值的谱平分法、基于电阻网络电压谱的快速谱分割法、基于Normal矩阵的谱平分法、GN算法等。由于衡量网络中不同结点的相似度比较困难,所以第二类中经典算法较少。第二类算法中比较有影响的方法主要有基于凝聚思想的Concor算法。
这些方法基本都为硬方法,即网络中的每个成员只能属于一个社区。另外,这些方法中除基于Normal矩阵的谱平分法,其余方法都需要先验知识:或者需要指定社区个数或都需要指定社区规模。
2.2 社区识别方法应用实例
近些年来,国外的学者从理论和实践两个方面对复杂网络进行了广泛而深入的研究和探讨。为了进行犯罪调查和防止犯罪,帮助法律执行部门和情报机构高效地从犯罪网络中进行知识发现,美国耗费三年时间开发了大型反犯罪网络工具CrimeNet Explorer,模拟实验证明该软件十分有效。“911”之后,反恐网络中的知识发现也一直是外国学者的研究目标,不但对一些恐怖袭击事件从复杂网络角度进行了分析,还证明了如果能够在事件发生之前就应用复杂网络理论对网络进行分析,完全可能阻止事件的发生,并将所有嫌犯绳之以法;另外,该文献还特别关注了网络的可视化问题。隐私保护是近年来的一个研究热点,Elena Zheleva等人对复杂网络中的隐私保护问题进行深入的研究,给出了攻击模型。研究作者合作网络也是一个重要的课题,Ulrik Brandes等人利用社区识别方法对维基百科的合作结构进行探讨,提出了描述和分析作者合作结构的模型和算法。BlockModel一直是复杂网络研究领域一个重要的模型,Edoardo M.Airoldi等人提出混合成员随机块模型,新模型较老模型有了较大的改进,可应用于蛋白质相互作用网络、基因常规网络、邮件网络等。基于网页的标签系统越来越流行,Cameron Marlow等人对标签系统应用于复杂网络进行了探讨。虚拟学习是教育界的一个热门话题,Bart Rieenties等人以复杂网络为工具研究了由学生构成的社会网络中学习动机、核心人物和边缘人物等对学习效果的影响。
国内对社区识别的研究相对落后,但在某些领域也取得了一些可喜成果。我国学者利用社区识别对人名检索结果重名消解问题进行了比较深入的研究。众所周知,人物重名现象十分普遍。搜索引擎的人名检索结果通常是多个同名人物相关网页的混合,郎君等人依据不同人物具有相同名字但却具有不同社会网络的思想,通过检索结果中共现的人名发现并拓展与检索人物相关的潜在社会网络,结合图的谱分割算法和模块度指标进行社会网络的自动聚类,在此基础上实现人名检索结果的重名消解。在人工标注的中文人名语料上进行实验,整体性能达到较好水平[1]。在社区识别方面,王慧芳等分析了传统社区发现算法的缺
原创力文档

文档评论(0)