- 3
- 0
- 约2.34万字
- 约 5页
- 2018-12-20 发布于山东
- 举报
k无线城市社团发现算法的研究.PDF
第35卷第12期 计 算 机 应 用 研 究 Vol35No12
2018年12月 ApplicationResearchofComputers Dec.2018
基于Spark无线城市社团发现算法的研究
王永贵,徐山珊,肖成龙
(辽宁工程技术大学软件学院,辽宁 葫芦岛125105)
摘 要:针对已有的社团发现算法存在时间复杂度较高、运行过程会产生大量重复团等问题,引入二叉树的存
储结构、权重排序、深度优先遍历的概念,与Spark基于内存计算的特点相结合,提出一种改进的并行化STCS
算法。通过搭建Spark大数据平台实现该算法,并与传统团搜索CS算法和基于Hadoop的MRTCS算法进行性
能对比。实验结果表明,STCS算法解决了生成结果冗余的问题,降低了时间代价,提升了社团发现算法的运行
速度和对海量数据的处理能力。
关键词:社团发现;权重排序;深度优先遍历;Spark
中图分类号:TP301.6 文献标志码:A 文章编号:10013695(2018)12364804
doi:10.3969/j.issn.10013695.2018.12.028
ResearchoncommunitydiscoveryalgorithmofwirelesscitybasedonSpark
WangYonggui,XuShanshan,XiaoChenglong
(CollegeofSoftware,LiaoningTechnicalUniversity,HuludaoLiaoning125105,China)
Abstract:Aimingattheexistingcommunitydiscoveryalgorithmhadtheproblemsofhighertimecomplexity,operation
processproducedalotofrepeategroup,etc.Thispaperintroducedtheconceptoftwobinarytreestoragestructure,weights
sorting,depthfirsttraversal,combinedwiththecharacteristicofSparkbasedonmemorycalculation,proposedanimproved
parallelSTCSalgorithm.ItbuiltSparkbigdataplatformtoimplementthealgorithm,andcomparedwiththetraditionalgroup
searchCSalgorithmandbasedonHadoopMRTCSalgorithm.ExperimentalresultsshowthattheSTCSalgorithmsolvesthe
problemofredundantresults,reducestimecost,improvesthespeedofthecommunitydiscoveryalgorithmandtheprocessing
capacityofmassivedata.
Keywords:communitydiscovery;weightedsorting;depthfirsttraversal;Spark
duce模型,提出了MRTCS算法,但面临大量的磁盘I/O操作
0 引言 的问题。
为进一步提升对海量数据的处理能力,本文提出了基于
随着互联网及社交软件的发展,社交网络也逐渐发展起
Spark的无线城市社团发现STCS
原创力文档

文档评论(0)