分布式社会网络分析支撑系统研究与应用计算机应用技术专业论文.docxVIP

分布式社会网络分析支撑系统研究与应用计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分布式社会网络分析支撑系统研究与应用计算机应用技术专业论文

洲Y 洲Y 川1 ㈣9 Ⅲ2 Ⅲ4删9 Ⅲ7 Ⅲ5 A Dissertation Submitted to Guangdong University of Technology for the Degree of Master of Engineering Science Research and Application of Distributed Social Network Analysis Support System Candidate:He Zhongyu Supervisor:Associate Prof.Wang Yong May 2011 Faculty of Comp uter Guangdong University of Technology Guangzhou,Guangdong,P R.China,51 0090 摘要摘要 摘要 摘要 随着互联网的快速发展,SNS网站的兴起,人们越来越多地通过网络进行沟通、 交流以及形成人际关系,由此产生了大量的用户数据。如何从海量的用户数据中取得更 深层次的有用信息,进而挖掘其中的潜在内容,如网络舆论扩散模型、网络用户群体属 性及商业价值等,是当前的重要研究方向和挑战。传统的社会网络分析工具和算法通常 都是基于单机的,在处理大规模数据集的时候往往会面临存储和处理能力不足等的问 题。而且,原始输入数据和社会网络结构描述都是无结构或半结构化的数据,传统关系 数据库并不善于处理此种类型的数据,从而在利用传统社会网络分析工具和算法处理大 规模数据集时变得更加困难。 本文提出了基于HBase的分布式社会网络分析支撑系统的解决方案,用于帮助用 户在对海量数据进行社会网络分析时,收集萃取数据,构建可分析的社会网络,对网络 内的个体或个体间关系进行分析,以得出这个社会网络的一些特征数据。系统主要功能 包括获取社会网络分析所需的数据,从数据中抽取网络关系,分布式社会网络构建,网 络图存储和分布式社会网络分析算法的设计,完整实现了进行社会网络分析的过程。 该解决方案通过融合HBase分布式体系结构和社会网络分析流程,建立了基于模 块的多层次体系结构。系统模块间采用松耦合设计,不同模块完成不同的功能,在不 改变系统功能前提下对任意模块的内部修改不影响其他模块的工作。在构建社会网络 时,系统通过开源爬虫从互联网,特别是社会化网站中获取构建社会网络相关的数据, 并从非结构或半结构化的原始输入数据中抽取出相关的社会网络关系,然后利用 MapReduce分布式构建社会网络,包括网络合并、边属性计算等。在支撑系统的存储 层设计了基于HBase的图存储系统,并针对社会网络结构的特性设计了图存储结构, 负责存储构建完成的社会网络,向上层应用提供各种所需图数据。在进行社会网络分 析时,通过图表述系统将社会网络抽象为一幅图,然后对图中的节点和边进行处理, 图表述系统向分布式社会网络分析算法提供图数据接口和预处理功能。最后,在支撑 系统的基础上,本文以节点度、节点强度及聚类系数分析为例介绍了基于MapReduce 的分布式社会网络分析算法的设计与实现过程,并进行实验和结果分析。 本文提出的基于HBase的分布式社会网络分析支撑系统经过实验验证,运行良好, 广东工业大学硕士学位论文适用于支撑对大规模社会网络数据集进行社会网络分析。 广东工业大学硕士学位论文 适用于支撑对大规模社会网络数据集进行社会网络分析。 关键字:社会网络分析;HBase;MapReduce;支撑系统 H hbst hbst ract ABSTRACT With the rapid development of Intemet and SNS,more and more people communicate through the network,a huge user data have been generated.How to obtain useful information from vast user data in a deeper level,and then mine the potential content,such as diffusion model of network public opinion,attributes of network user group and commercial value,is currently an important research direction and challenge.Traditional social network analysis tools and algorithms are usually stand—alone,their often

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档