- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
武汉理工大学硕士学位论文
武汉理工大学硕士学位论文
万方数据
万方数据
摘 要
随着微博等社交网络的快速兴起,社交网络的研究成为了一个热点课题, 如何更加充分的利用现代网络工具快速发掘网络中信息是一个重要的方向。基 于图挖掘的网络中节点聚类一直以来都是大规模网络数据分析中重要的研究课 题之一,众多研究者在网络社区的发现方面已经取得不少研究成果,但仍然存 在许多问题有待解决:算法的效率不高、很少关注重叠的社区结构、不能排除 噪音干扰等。信息可视化技术的发展为人们理解网络结构数据并进行有效的挖 掘提供了很有效的途径,但对于大规模社交网络传统的可视化布局并不能清晰 的展示。
针对这些问题,本文以 Spark 为平台,利用图挖掘,对社区网络展开了社区 发现及可视化的研究,具体内容如下:
(1)设计基于网络边图的社区发现算法及其并行化。针对 GN 算法不能发 现重叠社区和其复杂度较高的问题,将网络图转换为边图,用边图中节点的相 似度替代 GN 算法中的边介数,改进 GN 算法,并且利用 MapReduce 模型,对 该算法进行并行化处理,提高其执行效率。
(2)提出了基于用户影响力的社区发现算法及其并行化方案。针对基于局 部模块度的社区发现算法[26]不稳定问题,借鉴 PageRank 算法思想,研究社交网 络中用户影响力,将影响力大的用户作为初始社区节点,使得社区划分结果稳 定且更为准确,并研究了基于用户影响力的社区发现算法的并行化方法。
(3)设计基于 MapReduce 的力导向布局算法。分析串行的力导向布局算法, 结合 Spark 内存计算框架,实现了该算法的并行化,加快网络布局。
(4)提出了一种基于社区结构的社交网络可视化方法,该方法将社区结构 与力导向布局算法进行结合,改进力导向布局算法,在每个社区进行单独布局, 最终得到整个网络的布局,使之可以用于规模较大的社交网络可视化布局。
本文的创新点: 将用户影响力与局部社区发现算法结合,提出基于用户影响力的社区发现
算法,避免了局部社区发现算法的不稳定性,提高了其划分社区的准确性。 关键字: 社交网络;图挖掘;社区发现;力导向布局;可视化;内存计算
I
Abstract
With the rise of microblogging and social network rapidly, the research of social network has become a hot topic, how to make full use of modern network tools to find the information in the network quickly is an important direction. Based on the graph mining ,the clustering of node in network has been one of the important research topic in large-scale network, researchers in the community discovery has made a lot of achievements, but there are still many problems to be solved: the algorithms efficiency is not so high, very little attention to overlapping community structure, cannot eliminate noise interference. The development of information visualization technology provides a very effective means to let people understand the structure of the network and mining effectively, but for the traditional large-scale social network visualization layout is not clear.
Aiming at these problems, this thesis takes Spark as the platform, using the graph mining, launched a study of community discovery and visualization of social networks, the specific contents are as follo
您可能关注的文档
- 基于数据挖掘的烟草商业企业销售预测系统的设计与实现-软件工程专业论文.docx
- 基于力电耦合材料振动能量捕获研究-机械电子工程专业论文.docx
- 基于神经网络和预测控制的感应电机转速控制系统研究-电力系统及其自动化专业论文.docx
- 基于通断时间面积法的热计费系统设计-仪器仪表工程专业论文.docx
- 基于物联网的商场货品管理信息系统的设计与实现-软件工程专业论文.docx
- 基于纹理特征图像分割的分析-信号与信息处理专业论文.docx
- 基于无线Mesh网下的名誉节点机制研究-信号与信息处理专业论文.docx
- 基于网格计算平台的工作流管理模块的设计与实现-软件工程专业论文.docx
- 基于上下文感知计算的智能家居系统研究 计算机应用技术专业论文.docx
- 基于施工全过程的绿色施工评价体系研究-土木工程建造与管理专业论文.docx
- 基于全变差正则化法的腔内电阻抗成像逆问题研究-生物医学工程专业论文.docx
- 基于水力梯度的混凝土率型本构模型研究-结构工程专业论文.docx
- 基于输入理论的高职英语教师话语分析个案研究-外国语言学及应用语言学专业论文.docx
- 基于内容的自适应博客推荐方法的研究-计算机应用技术专业论文.docx
- 基于数据挖掘技术的高校信息采集分析系统设计开发-计算机技术专业论文.docx
- 基于网络传输测井数据无损压缩算法的研究-信号与信息处理专业论文.docx
- 基于调控范围语义相似性的致病基因预测方法-计算机应用技术专业论文.docx
- 基于可复用IP核的SOC测试研究-检测技术与自动化装置专业论文.docx
- 基于通用数据通信平台的内存数据库的设计与实现-软件工程专业论文.docx
- 基于可靠度理论的桥梁安全性评估及剩余寿命预测-桥梁与隧道工程专业论文.docx
最近下载
- 某某乡镇(中心)卫生院各岗位(包括临床医技科室)廉政(廉洁)风险点及防控措施一览表(最新最全最详细版本) .pdf VIP
- NICU或新生儿病室配奶室管理制度.docx VIP
- 孙子兵法__原文与译文.pdf VIP
- 2025中华护理学会团体标准——无创正压通气护理技术.pptx
- 非现场检查监管信息报送制度.docx VIP
- (高清版)DB33∕T 1291-2023 重大决策社会风险评估第三方服务规范.pdf VIP
- (完整版)20以内混合加减法大全_每页100题(直接打印).docx VIP
- 专题6.5 数列求和(举一反三)(新高考专用)(教师版) 2025年高考数学一轮复习专练(新高考专用).pdf VIP
- 培养未来的领导人 - Graduate School of Public and International Affairs.PDF VIP
- 连铸坯中心偏析和疏松缺陷在轧制过程中的形态演化.PDF VIP
原创力文档


文档评论(0)