- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社交网络中相关社区查询研究
摘 要
互联网上的许多应用形成了社交网络。社交网络上一些邻近节点构成
社区,社区就是联系紧密的成员聚集的一个子图结构。如何在社交网络中
发现和分析社区是目前的一个研究热点。研究工作的很大部分是关于社区
发现,即如何在整个社交网络中找出其中所隐含的所有社区。和社区发现
相对应的另一类研究是社区查询。社区查询是指:给定社交网络上的某个
节点作为查询点,找出该点所在的一个或多个社区。当查询点所在的社区
有多个时,这些社区称为重叠社区。
不少学者对社交网络中的社区查询进行了研究。这些研究中的社区查
询只查找查询点所在的社区。但我们的研究发现,在社交网络的实际应用
中,用户还经常会关心查询点不在,但与查询点相近的社区。如基于论文
合作关系形成的研究者社交网络中,某个研究者可能会查看他本人所在的
社区,也会查看他不在但邻近社区中有哪些研究人员,即那些和他研究工
作相近的研究人员。
本文引入相关社区的概念来解决上述问题,定义查询点可达的社区为
该查询点的相关社区。相关社区既包括查询点所在的社区,也包括查询点
不在,但有路径可达的社区。因而相关社区既可能与查询点邻近,也可能
处于社交网络上离查询点较远的位置。在实际应用中,当然主要关心那些
离查询点近的相关社区,即要找出离查询点最近的若干个相关社区,将该
问题称为Top-K 相关社区查询。
同时,研究领域和工商业大数据时代来临,数据量数据类型膨胀式的
增长,社交网络也急速发展,往往形成很大的图。针对大图的社区查询面
临着数据量大,单机装载计算困难的难题。同样,在相关社区查询的算法
设计上也面临着大数据的挑战。单台计算机的处理能力以及传统的技术架
构已经很难满足海量数据处理的计算要求,而分布式并行计算框架的出现
为海量数据下的数据处理带来了曙光。Hadoop 云平台为大数据的处理而
生,能够处理海量数据,但是其计算框架面临着计算单一,不支持循环迭
代计算等难题,基于 Hadoop 的Spark 内存计算平台集成了Hadoop 云平台
的优点,支持迭代计算,同时内存计算极大的减小了大数据计算处理的时
万方数据
间消耗。由此本文深入研究了Spark平台分布式大图社区查询计算算法,
提出大图中 Top-K 相关社区查询的解决方法。
论文在第一章和第二章介绍了研究背景,在第三章和第四章分别提出
一种社交网络中Top-K相关社区查询方法以及基于大数据平台的Top-K相
关社区查询算法研究,并分别在单机和集群环境 (Hadoop,Spark集群)进
行了测试验证和结果分析。其中大数据平台的 Top-K 相关社区查询算法研
究是对社交网络中Top-K 相关社区查询方法的补充与完善,它利用分布式
并行内存计算,解决了大图中相关社区查询的难题,并且通过算法改进,
进一步提高检索效率。本文的主要工作包括两个方面:
1提出一种社交网络中 Top-K 相关社区查询方法。本文定义了团和相
关社区的概念,研究一种快速检测查询点的 Top-K 相关社区的方法。文中
提出了一个向下探测搜索算法:从查询点出发探测团结构,再由团结构向
外延伸扩展得到社区,通过循环迭代快速得到查询点的Top-K 相关社区。
同时,为了减少搜索空间和计算时间,对原算法进行了改进。通过全面的
实验对比,验证了算法的有效性和改进算法的高效性。
2基于大数据平台的 Top-K 相关社区查询算法研究。大数据时代来临,
我们周围充斥的海量数据,对于海量数据的数据处理成为一个热点。社交
网络上社区探测的研究,也面临了大数据的冲击,怎样在大的社交网络图
上进行社区查询成为一个难点。定义查询节点可达的社区为其相关社区,
您可能关注的文档
最近下载
- 多联机空调施工组织方案.doc VIP
- 2022高三联考作文“孟子认为,人皆有恻隐之心”审题指导及优秀范文.docx VIP
- 印度世界——-美国洛杉矶郡艺术博物馆藏印度文物.pdf VIP
- 2023北京第二次高中学业水平合格性考试信息技术试卷试题(答案详解).pdf VIP
- 优迈优耐德扶梯IECB 扶梯控制柜-调试指导书.pdf
- 地砖铺贴施工方案与技术措施.docx VIP
- 多联机空调施工方案2.docx VIP
- 财务会计-开票加税点.xlsx VIP
- 内科院感工作计划科室院感度工作计划.docx VIP
- 2025课件-GB46768-2025有限空间作业安全技术规范PPT解读-新版.pptx
原创力文档


文档评论(0)