基于mapreduce框架下CNM算法的并行性研究.pdfVIP

基于mapreduce框架下CNM算法的并行性研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于mapreduce框架下CNM算法的并行性研究.pdf

计算机技术应用 ·theApplicationofComputerTechnology 基于mapreduce框架下CNM算法的并行性研究 文 /吕家琦 近年来,随着 网络技术的飞 快发展与应用,尤其是社交网络 的 日渐普及及应用,社 团发现成 为一项重要的研究课题。基 于模 块度的社 团发现算法对于现阶段 的社 团划分研 究具有重要意义。 CNM算法就是基于模块度的算法中 的一种。本文提 出了基于Hadoop 的MapReduce框 架 下对 CNM算法 的研究分析。最后展望了该领域 未来的研究方向。 键词】社团发现算法模块度a №佛 MapReduce 图1:MapReduce计算流程 随着社会的不断发展和个体之间关系的 i复杂,这给传统的社交网络带来了极大考 段有很多种类的发现方法。例如:基于模块度 聚合相似的节点或者联系最为紧密的节点,最 由此,各类社团发现算法应运而生。基于 优化的方法,分裂方法,谱方法,基于推理的 终将分散的小社团聚合为大的社团,从而达到 度的社区发现算法是现阶段较流行,研究 方法等等。 社团划分的目的。CNM 算法用堆的数据结构 广泛的算法。CNM算法就是这其中的一 1.1模块度 函数 来计算和更新网络的模块度,所以其时间复杂 但对于社交网络中日渐增长的庞大数据量, 度可接近线性复杂度。 传统的数据存储及处理方式提出了巨大的 所有的社 团发现算法都需要有一个评价 在 CHM 算法的执行过程中用到以下数据 E。将全部数据信息存入到内存或是硬盘中 标准来衡量社团发现结果的合理性和有效性。 结构: !变得不现实。由此,分布式处理方式进入 这便引入了模块度 的概念。模块度的定义 由 (1)模块度增量矩阵AQ:记录了有边 f究者的视线中。分布式系统,因拥有多种 Newman等人提出,是 目前常用的一种衡量网 相连的社团之间的模块度增量。 j的物理和逻辑资源,可以动态的分配任务, 络中社区稳定度的方法。下面引入模块度的定 (2)最大堆H:该堆中包含了模块度增 《的物理和逻辑资源通过计算机网络实现信 义: 量矩阵△O中每一行中的最大元素。 换,鉴于分布式系统具有的高吞吐、高并 给定一个图G,它表示一个社交网络,C (3)辅助向量a:用来记录节点的度。 低延迟性的特点,可满足当今社团网络处 表示社交网络中的社区,m表示G中边的数量, j要求。 2MapReduce框架介绍 则: Hadoop是一个能够对大量数据进行分布 e=I/2m若节点i和j之间有边相连,否 MapReduc

文档评论(0)

月光般思恋 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档