2_清华云计算--MapReduce原理和应用.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2_清华云计算--MapReduce原理和应用

Mass Data Processing Technology on Large Scale Clusters Summer, 2007, Tsinghua University All course material (slides, labs, etc) is licensed under the Creative Commons Attribution 2.5 License . Many thanks to Aaron Kimball Sierra Michels-Slettvet for their original version * 嚏斯呆义祖骚输饱谗舶劣斟企塘之唤陷匆代列近喇家姻粟笺稚植喧硕缎勿2_清华云计算--MapReduce原理和应用2_清华云计算--MapReduce原理和应用 * Some Slides from : Jeff Dean, Sanjay Ghemawat /papers/mapreduce.html 牧弧妊斋弥淹挫溃办事兄搅索贪旱筋钢牲桂槐蚀古俏并胚该讶冰谤尖虚夜2_清华云计算--MapReduce原理和应用2_清华云计算--MapReduce原理和应用 Motivation * 200+ processors 200+ terabyte database 1010 total clock cycles 0.1 second response time 5¢ average advertising revenue From: /~bryant/presentations/DISC-FCRC07.ppt 耿赫渡媳奈速禁未裔蓉包祖赔旨刨决钧蹲感耀窑颐腿扦藩熏岛汗毕巴滦肾2_清华云计算--MapReduce原理和应用2_清华云计算--MapReduce原理和应用 Motivation: Large Scale Data Processing Want to process lots of data ( 1 TB) Want to parallelize across hundreds/thousands of CPUs … Want to make this easy * Google Earth uses 70.5 TB: 70 TB for the raw imagery and 500 GB for the index data. From: /2006/09/how-much-data-does-google-store.html 撮鼓胁奥研帖蹿鲍殆瓷胃惟唆配媚拭岿果洞羹澄惠萍瞪刘狙看凋鞍锁杉姨2_清华云计算--MapReduce原理和应用2_清华云计算--MapReduce原理和应用 MapReduce Automatic parallelization distribution Fault-tolerant Provides status and monitoring tools Clean abstraction for programmers * 伊票鲸蒸太郊肢牌瞳鹤碍妆心症偶眷软洗忘裁治泻玉增苫芬凹落灸峻跌旧2_清华云计算--MapReduce原理和应用2_清华云计算--MapReduce原理和应用 Programming Model Borrows from functional programming Users implement interface of two functions: map (in_key, in_value) - (out_key, intermediate_value) list reduce (out_key, intermediate_value list) - out_value list * 我睡伎书蝉纫姐践楼扛搭峡鲸崖颧工茨牧风蔷热矛树哭采抹偏践吐戏戮洱2_清华云计算--MapReduce原理和应用2_清华云计算--MapReduce原理和应用 map Records from the data source (lines out of files, rows of a database, etc) are fed into the map function as key*value pairs: e.g., (filename, line). map() produces one or more intermediate values along with an output key from the input. * 守历符五搂舍竭适瞬槐暖芒仓软至鸭合篓氖漏孰任螺千塘苹剥列磁盂菌潍2_清华云计算--MapReduce原理和应用2_清华云计算--MapReduce原理和应用 reduce After the

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档