一种从移动通信数据中现发团体结构的方法.docVIP

一种从移动通信数据中现发团体结构的方法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种从移动通信数据中现发团体结构的方法.doc

《浙江工商大学学报(自然版)》排版格式样本 一种从移动通信数据中发现团体结构的方法 马力 (浙江工商大学 计算机与信息工程学院,杭州 310035) 摘 要:本文提出了一种从移动通信数据中自动发现团体结构的方法。该方法采用改进的基于边的介数的聚类算法,可以从信息流图中快速确定团体结构。用一个时间跨度为2个月,容量为12251条记录的实际的移动通信数据集测试该方法,结果证明该方法能有效地确定团体结构。 关键词:介数;复杂网络;移动通信;算法 中图书分类号: 文献标识码: 文章编号: 0 引言 研究社会网络中的团体结构,关于确定在线团体的研究越来越多。许多研究者把电子邮件列表和个人主页作为社会关系的在线代理, 并且利用这些在线代理确定机构中的团体结构[1-2]。如Tyler等利用电子邮件列表作为人际交流的指示器,提出了一种确定一个机构中的团体结构的全自动的方法[3,9]。 网络团体结构的定义 若论文受到省、部级以上基金项目支助,请注明基金名称和项目号 实际的网络往往具有团体结构,其中一些节点相互之间的联系形成了一个紧密的团体,而这些团体之间却只有松散的联系,如图1所示[4]。 图1 具有3个团体的网络 收稿日期:2005-10-21 基金项目:国家自然科学基金 作者简介:马力 (1966-),男,浙江绍兴人,浙江工商大学计算机与信息工程学院副教授,主要从事复杂网络和数据挖掘研究。 在数学上,网络一般表示成图,其中集合V表示节点(对应于网络中的个体),集合E表示连接结点的边(对应于个体间的关系)。设Ai,j是G的邻接矩阵(Adjacency Matrix),则对于G中的结点i,其度值(Degree)。考虑一个子图,若,则节点i的度值度值可以两个部分,一部分是节点i与属于W的节点相连的边数:;另一部分是节点i与V以外的节点相连的边数:。 若(1)成立,则称W是G中的一个团体,式中α越大则W的团体特性越明显。 , (1) 2 基于边的介数的网络分割算法 从网络中发现团体结构可视为网络分割问题,传统的方法有谱分割法(Spectral Bisection)和等级聚类法(Hierarchial Clustering)[5-6]。谱分割法将网络一分为二,当网络中团体数比较多时,往往不能给出一个好的结果。等级聚类法不能直接给出网络中团体数,而且对于大型网络并不适用。Given和Newman于2002年提出了基于边的介数的聚类算法(G-N算法),并将其应用于社会网络和生物网络的团体结构分析。[7] 介数(Betweenness)是由Freeman于1979年首先提出的。在图中, 设σst=σts代表从节点s∈V到结点 t∈V路径的数目。设σst(v)代表从节点s到结点t的最短路径经过节点v∈V的数目。则节点的介数的定义是: [8] (2) 我们同样可以定义边的介数。在图中,设σst(e)代表从节点s到节点t的最短路径经过边e∈E 的数目,边e的两个端点分别为u、v。则边的介数的定义是: (3) 边的介数决定于通过它的最短路径数。络中团体间的边连接了许多不同团体中的节点,所以其介数大,而团体内部的边的介数相对较小,这种特性可以用来区分团体间的边和团体内部的边。考察图2所示的网络,它含有1#和2#两个明显的团体,这两个团体有边AB相连,边AB具有最大的介数。如果去掉这条边,则网络分解为两个独立的团体。对于一个待分析的网络,我们计算其每条边的介数,确定其中介数最大的边,然后将它们删除,然后再计算剩下边的介数,再去掉介数最大的边。重复去边过程,直到所有边都被去掉,记录所有的去边过程,反过来就是各个结点组成团体的顺序,这就是基于边的介数的聚类法[9]55。 图2 连接不同团体的边具有大的介数 3 发现团体结构的方法 我们对基于边的介数的聚类法进行了改进,以此为基础,设计了一种从移动通信数据中发现团体结构的方法,它主要由数据采集、数据处理、网络分割和结果验证四个步骤组成。 3.1数据采集 数据采集是发现团体结构的方法的基础。首先确定一个网络(如某个班级),然后确定数据采集的起始和终止时间,再要求该网络中的每个成员提供上述时间段内的移动电话通话清单。目前中国移动和中国联通两大移动通信公司都提供通话清单下载服务,下载的文件为TXT格式,所以如果网络中的成员积极配合,可以方便地采集数据。 3.2数据处理 数据处理将采集的原始数据转换为邻接矩阵。 首先,本着保护个人隐私的原则,对原始数据进行了筛选,删除了收件人或发件人为网络以外人员的通讯记录,同时对每条记录的发送人(呼叫方号

文档评论(0)

docinpfd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5212202040000002

1亿VIP精品文档

相关文档