基于Mapreduce的大规模社会网络提取方法研究.doc

基于Mapreduce的大规模社会网络提取方法研究.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于Mapreduce的大规模社会网络提取方法研究

施 佺1,2 ,肖仰华3 ,温文灏3 ,朱乾钱3 ,王恒山1 ( 1. 上海理工大学 管理学院,上海 200093; 2. 南通大学 计算机科学与技术学院,江苏 南通 226019; 3. 复旦大 学 计算机科学技术学院,上海 200433) 摘 要: 从海量非规范 Web 数据源提取大规模高质量的社会网络有着广阔应用前景和较高学术价值,同时也 面临着海量计算所带来的巨大挑战。为此,以 Digg 新闻评论网站为信息源,以提取网站用户之间的共同兴趣网 络为主要目标,提出了基于云平台的社会网络提取系统框架,实现了基于 Mapreduce 的大规模社会网络提取方 法。实验结果表明,提出的方法具有较好的扩展性和伸缩性,能够胜任从异构 Web 数据源提取高质量的大规模 社会网络的计算任务。 关键词: 社会网络提取; 关系提取; 云计算; Mapreduce; 社会网络 中图分类号: TP311 文献标志码: A 文章编号: 1001-3695( 2011) 01-0145-04 doi: 10. 3969 / j. issn. 1001-3695. 2011. 01. 041 Research on method for extracting large-scale social network based on Mapreduce SHI Quan1,2 ,XIAO Yang-hua3 ,WEN Wen-hao3 ,ZHU Qian-qian3 ,WANG Heng-shan1 ( 1. School of Management,University of Shanghai for Science & Technology,Shanghai 200093,China; 2. School of Computer Science & Tech- nology,Nantong University,Nantong Jiangsu 226019,China; 3. School of Computer Science,Fudan University,Shanghai 200433,China) Abstract: Extracting large-scale social networks from massive heterogeneous Web data is of both theoretical and practical sig- nificance. However,one of definite features of this task was large-scale computing,which remains to be a great challenge that would be addressed. Cloud computing platform had provided us new opportunity to overcome this challenge. Hence,efforts would be dedicated to investigate the methods to extract large social network from Web data by cloud computing techniques. Specifically,proposed a Mapreduce-based approach to extract common interest network from DIGG. The experimental results show that the proposed method has good scalability and extensibility,having the capability to extract large-scale social network of high quality from heterogeneous Web data sources. Key words: social network extraction; relation extraction; cloud computing; Mapreduce; social network 0 引言 社会网络是由各种社会实体及其之间的关系构成的。社 会网络分析( social network analysis,SNA) 是理解人类行为、分 析社会结构的重要工具。社会网络分析不仅在社会学各领域 得到普遍应用,在情报学、信息检索、信息行为和信息计量学领 域也得到推广和应用; 社会网络分析还对网络知识发掘、科学 评价、网络信息

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档