- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于mapreduce框架下CNM算法的并行性研究.pdf
计算机技术应用 ·theApplicationofComputerTechnology
基于mapreduce框架下CNM算法的并行性研究
文 /吕家琦
近年来,随着 网络技术的飞
快发展与应用,尤其是社交网络
的 日渐普及及应用,社 团发现成
为一项重要的研究课题。基 于模
块度的社 团发现算法对于现阶段
的社 团划分研 究具有重要意义。
CNM算法就是基于模块度的算法中
的一种。本文提 出了基于Hadoop
的MapReduce框 架 下对 CNM算法
的研究分析。最后展望了该领域
未来的研究方向。
键词】社团发现算法模块度a №佛
MapReduce
图1:MapReduce计算流程
随着社会的不断发展和个体之间关系的
i复杂,这给传统的社交网络带来了极大考
段有很多种类的发现方法。例如:基于模块度 聚合相似的节点或者联系最为紧密的节点,最
由此,各类社团发现算法应运而生。基于
优化的方法,分裂方法,谱方法,基于推理的
终将分散的小社团聚合为大的社团,从而达到
度的社区发现算法是现阶段较流行,研究
方法等等。 社团划分的目的。CNM 算法用堆的数据结构
广泛的算法。CNM算法就是这其中的一
1.1模块度 函数 来计算和更新网络的模块度,所以其时间复杂
但对于社交网络中日渐增长的庞大数据量,
度可接近线性复杂度。
传统的数据存储及处理方式提出了巨大的
所有的社 团发现算法都需要有一个评价 在 CHM 算法的执行过程中用到以下数据
E。将全部数据信息存入到内存或是硬盘中
标准来衡量社团发现结果的合理性和有效性。 结构:
!变得不现实。由此,分布式处理方式进入
这便引入了模块度 的概念。模块度的定义 由 (1)模块度增量矩阵AQ:记录了有边
f究者的视线中。分布式系统,因拥有多种
Newman等人提出,是 目前常用的一种衡量网 相连的社团之间的模块度增量。
j的物理和逻辑资源,可以动态的分配任务,
络中社区稳定度的方法。下面引入模块度的定 (2)最大堆H:该堆中包含了模块度增
《的物理和逻辑资源通过计算机网络实现信
义: 量矩阵△O中每一行中的最大元素。
换,鉴于分布式系统具有的高吞吐、高并
给定一个图G,它表示一个社交网络,C (3)辅助向量a:用来记录节点的度。
低延迟性的特点,可满足当今社团网络处
表示社交网络中的社区,m表示G中边的数量,
j要求。 2MapReduce框架介绍
则:
Hadoop是一个能够对大量数据进行分布
e=I/2m若节点i和j之间有边相连,否
MapReduc
文档评论(0)