- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于邻域结构洞社团发现算法
基于邻域结构洞社团发现算法
【摘 要】为了解决传统社团发现算法仅考虑复杂网络的局部属性的问题,构建以移动用户之间的通话数据为基础的移动用户通信网络,通过采用“邻域”结构洞衡量用户之间的关系强度,利用模块度值寻找社团划分的最优“关系阈值”,提出了基于“邻域”结构洞的社团发现算法。经过实验证明,该算法具有一定的有效性和扩展性。
【关键词】复杂网络 社团结构 “邻域”结构洞 模块度值
1 引言
社团结构是描述社会网络具有一个共同的性质,即满足同一社团内部节点连接相对紧密、不同社团节点连接相对稀疏的特点[1]。目前社团发现的研究算法大致可以划分为图形分割和分级聚类两种。其中,图形分割的主要代表算法有:基于贪婪思想实现极小化簇间连接数目与簇内连接数目之差的Kernighan-Lin算法[2];基于特征值的相似性实现社团划分的Laplace图特征值的谱平分算法[3];基于边密度的CPM派系过滤算法[4]。分级聚类是根据网络中不同节点的连接强度实现社团的划分,该算法根据对网络的操作不同分为两种:分裂算法的典型代表是GN算法,通过删除网络中介数大的边获得社团结构;凝聚算法的典型代表是Newman快速算法,其思想是从空网络开始,逐步添加相似性的边,同时在计算相似性时通过模块度来标示社团分割的质量[5]。上述的社团发现算法仅仅考虑复杂网络的局部属性,如考虑节点自身的信息以及其邻居的信息而忽略邻居的邻域信息,会对节点与邻居的连接强度产生大的影响,因此本文提出了基于“邻域”结构洞的社团发现算法。该算法是利用节点以及其邻居的“邻域”结构洞来评价节点与邻居的关系强度,同时采用模块度值挖掘社团划分的最优“关系阈值”,实现在特定数据下大幅度提高社团划分的效率和精度。
2 复杂网络中的社团发现
2.1 社团结构的定义
在绝大多数的研究中,社团的定义是从功能角度上给出的,研究者们利用网络节点的拓扑结构试图找出社团的功能模块,并从拓扑结构给出了社团的定义,即:社团是一组内部连接紧密但与组外其他节点连接稀疏的节点的集合[6]。但是,高度重叠的社团违背了上述定义,因此Ahn于2010年将社团定义为一组紧密相关的链接,让节点继承与之相连接的社团的隶属关系,从划分链接的角度来解释复杂网络的重叠结构。
本文在参考Ahn划分社团思路的基础上,通过评价节点间的关系强度,采用模块度值作为寻找关系强度的最优“阈值”,在提升同类别数据社团划分效率的同时也符合复杂网络重叠社团划分的原则。
2.2 社团结构的应用场景
社团结构划分具有多个应用场景:通过社团发现获取道路网络的社团结构,可以更直观地展现每个区域的道路分布情况、道路密集区域和道路稀疏区域的具体分布;通过社团发现获取不同消费类型的用户社团结构,有利于运营商根据不同用户的消费水平进行有区别的市场推广;通过社团发现算法挖掘金融欺诈分子的社团结构,提高了反欺诈的识别率,从而保护了国家财产的安全,等等。
2.3 社团结构的评价
如何判断一个社团发现算法划分的社团结构好坏,一般可由以下指标来衡量:
(1)标准互信息是需要事先知道真实社团划分的结构,当社团发现算法得到的社团划分结构与真实社团划分结构越接近时,它们之间的标准互信息就越接近1,该值的取值范围为0至1。
(2)模块度是当前社团发现领域最认可的评价社团结构好坏的指标,它表示社团划分后社团内部的紧凑程度,当社团越紧凑时,模块度的取值就越接近1。当然,模块度的取值与社团划分的精度没有必然的关系。
(3)社团划分精度与标准互信息类似,需要事先知道真实社团划分的结构。它等于正确划分的节点个数与节点总数的占比。
2.4 基于“邻域”结构洞的用户关系评价
(1)结构洞理论
结构洞是学者Burt在研究社会网络的竞争关系时提出的经典社会学理论[7]。结构洞是指非冗余联系人之间存在的缺口,一旦结构洞存在,那么结构洞两边的联系人可以带来累加而非重叠的网络收益。结构洞示意图如图1所示:
从图1可知,节点A和节点B存在结构洞,而充当联系角色的中间人“E”获得了更多的网络收益,因为节点A和节点B之间的信息传播必须由中间人“E”来完成,所以在该网络中,中间人“E”的重要性大于其他节点。
(2)基于结构洞理论的节点重要性评价
在进行节点重要性评价之前,本文通过节点的度选取种子节点,因为只有选取种子节点后,结构洞的评价系数才能为社团发现带来实质的价值。节点重要性评价的计算示意图如图2所示:
从图2可知,I作为网络中度数最多的节点,本文将以I为种子节点,计算它与各节点的关系,以便划分以I为中心的社团。根据Burt对网络节点形成的结构洞的约束系数定义,CIA表示评价节点I和节点A之间的
原创力文档


文档评论(0)