- 1、本文档共51页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Google三大法宝之一:MapReduce 矩阵乘法串行实现 1: for i=1;i=N;i++ 2: for j=1;j=N;j++ 3: 4: 5: 6: for k=1;k=N;k++ C[i][j] += A[i][k]*B[k][j] end for end for 7: end for ? 算法复杂度:O(N3) ? 以1次乘法需要1个时钟周期,计算10亿维度矩阵为 例,使用1G的CPU,需要的计算时间为: t = 10亿×10亿×10亿 / 10亿 = 317年! 是否OK? 想办法解决大规模矩阵相乘问题:我拆 ? Cm = Am ⅹ B ? M台服务器并行计算,时间降低为1/M C A B C1 Cm CM A1 Am AM = ⅹ 想办法解决大规模矩阵相乘问题:我再拆 ? Cm,n = Am ⅹ Bn ? M ⅹM台服务器并行计算,时间降低为1/M2 C A B A1 Am AM = ⅹ C1,1 Cm,1 CM,1 B1 Bn BM 子任务 子任务 子任务 … 拆的本质- 分而治之 ? 分而治之 – Divide and Conquer – 一个大的计算任务分解为若干小计算任务 – 子任务计算结果合并后获得最终结果 计算任务 Divide Conquer 计算结果 MapReduce的来源 ? 编程模型: – 1956年John McCarthy(图灵奖获得者)提出的Lisp语言中的 Map/Reduce方法 – Map输入是一个函数和n个列表,输出是一个新的列表,列表中的元素是 将输入函数作用在n个输入列表中每个对应元素获得的计算结果。 – Reduce输入是一个函数和一个列表,输出是将函数依次作用于列表的每 个元素后获得的计算结果 (map vector #* #(1 2 3 4 5) #(5 4 3 2 1) - #(5 8 9 8 5) (reduce #+ #(5 8 9 8 5)) - 35 Lisp中的Map和Reduce操作 MapReduce原理 Source:sun.fim.uni-passau.de/cl/MapReduceFoundation/ MapReduce机制 ? 主控程序(Master):将Map和Reduce分配到合适的工作机上 ? 工作机(Worker):执行Map或Reduce任务 MapReduce不仅仅是编程模型! ? 让程序员在使用MapReduce时面对以下细节问题? – 大数据如何分割为小数据块? – 如何调度计算任务并分配和调度map和reduce任务节点? – 如何在任务节点间交换数据? – 如何同步任务? – 相互依赖的任务是否执行完成? – 任务节点失效时该如何处理? ? Google的MapReduce是一个完整的计算框架 – 程序员只需要编写少量的程序实现应用层逻辑 程序示例:WordCount #include mapreduce/mapreduce.h class WordCounter : public Mapper { public: virtual void Map(const MapInput input) { const string text = input.value(); const int n = text.size(); for (int i = 0; i n; ) { while ((i n) isspace(text[i])) i++; int start = i; while ((i n) !isspace(text[i])) i++; if (start i) Emit(text.substr(start,i-start),1); }}}; REGISTER_MAPPER(WordCounter); class Adder : public Reducer { virtual void Reduce(ReduceInput* input) { int64 value = 0; while (!input-done()) { value += StringToInt(input-value()); input-NextValue(); } Emit(IntToString(value)); }}; REGISTER_REDUCER(Adder); int main(int argc, char
您可能关注的文档
- 大型商业中心五一活动总结报告.ppt
- 大华智能交通方案及产品.pptx
- 大型团日活动之党团知识竞赛.ppt
- 大型文艺晚会策划方案.ppt
- 大型景观歌剧《图兰朵》合作方案.ppt
- 大型活动策划与管理.ppt
- 大型滨海旅游度假产品:整合营销策划方案.ppt
- 大型灌区更新改造项目管理介绍(2013.9).ppt
- 大学个人团队SWOT分析企业文化.ppt
- 大型购物中心运营与营销策划.ppt
- 唐山工业职业技术学院《形势与政策》期末考试过关检测试卷附完整答案详解(网校专用).docx
- 南通科技职业学院《形势与政策》期末考试考前冲刺练习题含完整答案详解(夺冠).docx
- 2025陕西工业职业技术学院《形势与政策》期末考试复习提分资料附答案详解(模拟题).docx
- 山东华宇工学院《形势与政策》期末考试能力检测试卷及1套完整答案详解.docx
- 2025安顺职业技术学院《形势与政策》期末考试模拟试题(名校卷)附答案详解.docx
- 2024安徽工贸职业技术学院《形势与政策》期末考试考前冲刺练习题【研优卷】附答案详解.docx
- 2024嵩山少林武术职业学院《形势与政策》期末考试高分题库及完整答案详解【历年真题】.docx
- 2024南通职业大学《形势与政策》期末考试自我提分评估含完整答案详解【名校卷】.docx
- 2025仙桃职业学院《形势与政策》期末考试全真模拟模拟题及答案详解【易错题】.docx
- 2025安徽卫生健康职业学院《形势与政策》期末考试检测卷附答案详解(实用).docx
最近下载
- 中国糖尿病足诊治指南(2024版)解读.pptx VIP
- 《中国保险业意外伤害经验发生率表(2021)》.pdf VIP
- 安伯格GRP1000 IMS技术详细说明.docx VIP
- 采购变更管理方案.docx VIP
- 电网调度规程.pptx VIP
- WS∕T 779-2021 儿童血细胞分析参考区间.pdf
- 2025浙江省“三支一扶”计划招募270人笔试备考试题及答案解析.docx VIP
- 通信工程师中级考试(传输与接入有线务实)2021真题.pdf VIP
- 全国服装设计与工艺赛项理论知识试题及答案.doc VIP
- DB3707_T 033-2021 智慧供热系统建设技术规范.docx VIP
文档评论(0)