k无线城市社团发现算法的研究.PDFVIP

  • 3
  • 0
  • 约2.34万字
  • 约 5页
  • 2018-12-20 发布于山东
  • 举报
k无线城市社团发现算法的研究.PDF

第35卷第12期 计 算 机 应 用 研 究 Vol35No12 2018年12月  ApplicationResearchofComputers Dec.2018 基于Spark无线城市社团发现算法的研究 王永贵,徐山珊,肖成龙 (辽宁工程技术大学软件学院,辽宁 葫芦岛125105) 摘 要:针对已有的社团发现算法存在时间复杂度较高、运行过程会产生大量重复团等问题,引入二叉树的存 储结构、权重排序、深度优先遍历的概念,与Spark基于内存计算的特点相结合,提出一种改进的并行化STCS 算法。通过搭建Spark大数据平台实现该算法,并与传统团搜索CS算法和基于Hadoop的MRTCS算法进行性 能对比。实验结果表明,STCS算法解决了生成结果冗余的问题,降低了时间代价,提升了社团发现算法的运行 速度和对海量数据的处理能力。 关键词:社团发现;权重排序;深度优先遍历;Spark 中图分类号:TP301.6   文献标志码:A   文章编号:10013695(2018)12364804 doi:10.3969/j.issn.10013695.2018.12.028 ResearchoncommunitydiscoveryalgorithmofwirelesscitybasedonSpark WangYonggui,XuShanshan,XiaoChenglong (CollegeofSoftware,LiaoningTechnicalUniversity,HuludaoLiaoning125105,China) Abstract:Aimingattheexistingcommunitydiscoveryalgorithmhadtheproblemsofhighertimecomplexity,operation processproducedalotofrepeategroup,etc.Thispaperintroducedtheconceptoftwobinarytreestoragestructure,weights sorting,depthfirsttraversal,combinedwiththecharacteristicofSparkbasedonmemorycalculation,proposedanimproved parallelSTCSalgorithm.ItbuiltSparkbigdataplatformtoimplementthealgorithm,andcomparedwiththetraditionalgroup searchCSalgorithmandbasedonHadoopMRTCSalgorithm.ExperimentalresultsshowthattheSTCSalgorithmsolvesthe problemofredundantresults,reducestimecost,improvesthespeedofthecommunitydiscoveryalgorithmandtheprocessing capacityofmassivedata. Keywords:communitydiscovery;weightedsorting;depthfirsttraversal;Spark duce模型,提出了MRTCS算法,但面临大量的磁盘I/O操作 0 引言 的问题。 为进一步提升对海量数据的处理能力,本文提出了基于 随着互联网及社交软件的发展,社交网络也逐渐发展起 Spark的无线城市社团发现STCS

文档评论(0)

1亿VIP精品文档

相关文档