- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于Mapreduce的大规模社会网络提取方法研究
施 佺1,2 ,肖仰华3 ,温文灏3 ,朱乾钱3 ,王恒山1
( 1. 上海理工大学 管理学院,上海 200093; 2. 南通大学 计算机科学与技术学院,江苏 南通 226019; 3. 复旦大 学 计算机科学技术学院,上海 200433)
摘 要: 从海量非规范 Web 数据源提取大规模高质量的社会网络有着广阔应用前景和较高学术价值,同时也 面临着海量计算所带来的巨大挑战。为此,以 Digg 新闻评论网站为信息源,以提取网站用户之间的共同兴趣网 络为主要目标,提出了基于云平台的社会网络提取系统框架,实现了基于 Mapreduce 的大规模社会网络提取方 法。实验结果表明,提出的方法具有较好的扩展性和伸缩性,能够胜任从异构 Web 数据源提取高质量的大规模 社会网络的计算任务。
关键词: 社会网络提取; 关系提取; 云计算; Mapreduce; 社会网络
中图分类号: TP311 文献标志码: A 文章编号: 1001-3695( 2011) 01-0145-04 doi: 10. 3969 / j. issn. 1001-3695. 2011. 01. 041
Research on method for extracting large-scale social network based on Mapreduce
SHI Quan1,2 ,XIAO Yang-hua3 ,WEN Wen-hao3 ,ZHU Qian-qian3 ,WANG Heng-shan1
( 1. School of Management,University of Shanghai for Science & Technology,Shanghai 200093,China; 2. School of Computer Science & Tech- nology,Nantong University,Nantong Jiangsu 226019,China; 3. School of Computer Science,Fudan University,Shanghai 200433,China)
Abstract: Extracting large-scale social networks from massive heterogeneous Web data is of both theoretical and practical sig- nificance. However,one of definite features of this task was large-scale computing,which remains to be a great challenge that would be addressed. Cloud computing platform had provided us new opportunity to overcome this challenge. Hence,efforts would be dedicated to investigate the methods to extract large social network from Web data by cloud computing techniques. Specifically,proposed a Mapreduce-based approach to extract common interest network from DIGG. The experimental results show that the proposed method has good scalability and extensibility,having the capability to extract large-scale social network of high quality from heterogeneous Web data sources.
Key words: social network extraction; relation extraction; cloud computing; Mapreduce; social network
0 引言
社会网络是由各种社会实体及其之间的关系构成的。社 会网络分析( social network analysis,SNA) 是理解人类行为、分 析社会结构的重要工具。社会网络分析不仅在社会学各领域 得到普遍应用,在情报学、信息检索、信息行为和信息计量学领 域也得到推广和应用; 社会网络分析还对网络知识发掘、科学 评价、网络信息
您可能关注的文档
- 土石围堰渗流场分析及稳定性评价.docx
- 土源性蠕虫卵的检查方法与识别.ppt
- 土豆冷冻干燥工艺的试验研究.docx
- 圣地温泉酒店开业活动策划方案.ppt
- 在Java中使用图片实现GUI的美化.doc
- 圣西门简介 .ppt
- 在华西人报刊与鸦片战争.doc
- 在国家工商总局个体司联系点座谈会上的讲话.doc
- 在国际人力资源管理研究范畴中.doc
- 在均匀外磁场里的铁磁椭球内外磁场和磁力的解析计算及其功用.docx
- 北师大版小学数学三年级上册《寄书》教学设计.docx
- 统编版(部编版)语文二年级上册《雪孩子》教学设计.docx
- 统编版(部编版)语文二年级上册《八角楼上》教学设计.docx
- 北师大版小学数学三年级上册《长方形周长》教学设计.docx
- 北师大版小学数学三年级上册《丰收了》教学设计.docx
- 统编版(部编版)语文二年级上册《夜宿山寺》教学设计.docx
- 统编版(部编版)语文二年级上册《风娃娃》教学设计.docx
- 统编版(部编版)语文二年级上册《朱德的扁担》教学设计.docx
- 统编版(部编版)语文二年级上册《难忘的泼水节》教学设计.docx
- 统编版(部编版)语文二年级上册《纸船和风筝》教学设计.docx
最近下载
- 2025届高考语文专项复习:专题二+文学类文本阅读·小说.pptx VIP
- 2025届高考语文复习:文学类文本阅读之小说+考点1+赏析小说的叙述特征+课件.pptx VIP
- 2025届高考语文复习:文学类文本阅读之小说+课件.pptx VIP
- 《工业设计史 》课件第四章机械化与设计.ppt
- 中华民族共同体概论课件专家版6第六讲 五胡入华与中华民族大交融(魏晋南北朝).pptx VIP
- 2021-2022学年北京市海淀区七年级(上)期中数学试卷.doc VIP
- Unit 4 Do it yourself reading 教学设计2024-2025学年牛津译林版英语八年级上册.docx VIP
- Norman Bethune 诺尔曼·白求恩英文介绍.pptx
- 人教版五年级上册数学全册教案教学设计含教学反思.pdf VIP
- 湖北省武汉市第四十九中学2024-2025学年高一上学期10月月考地理试题 (含答案).pdf VIP
文档评论(0)