- 3
- 0
- 约1.41千字
- 约 12页
- 2018-05-11 发布于江苏
- 举报
基于位置感知和负载均衡MapReduce的Join算法优化2
Part 1 Part 1 Part 2 Part 3 Part 4 * Part 2 Part 1 Part 2 Part 3 Part 4 * Part 3 Part 1 Part 2 Part 3 Part 4 * Part 4 Part 1 Part 2 Part 3 Part 4 * Part 5 基于位置感知和负载均衡 MapReduce的Join算法优化 汇报人:黄梓铭 厦大数据库实验室 2015-3-7 目录页 CONTENTS PAGE P1.Reduce-side Join P2.已有的研究方法 P3.我的创新点 P4.总结 Reduce-side Join Reduce-side Join 表A 表B 以id为key连接 Mapreduce的Join过程 Hadoop现有的划分方法以组为单位进行划分,具有相同键的所有记录被分配到同一个Reducer进行处理.这种划分方法没有考虑每个组内包含的记录数目。比如partition函数是通过hash函数来觉决定分区结果。如果是数据均衡情况下,分区效果还是很理想的。但是在数据倾斜的情况下,就会出现一些较大key值被分配到同一个Reducer上照成负载的不均衡。比如下面这个例子。 所以我们主要就是要通过设计新的partition函数来替换掉已有的hash函数,已解决负载不均衡的问题。接下来我们看看已有的研究成果。 已有研
您可能关注的文档
- 垃圾处理的数学建模9.doc
- 城区学区通道、生命通道区域房屋征收.doc
- 城市公路信息网年会祝酒词(多篇).doc
- 城市垃圾转运站设计规范 CJJ47-91.pdf
- 城市排水防涝是事关民生问题和城市安全的重要工作,2.PDF
- 城市管理专业毕业生求职信(多篇).doc
- 城市管理人员自我鉴定(多篇).doc
- 城市规划专业大学生的求职信(多篇).doc
- 城市运营时代的规划十四要点.PDF
- 培训公司员工辞职申请书(多篇).doc
- 50万吨汽油调和技改项目环评报告书.pdf
- 河北省文安县第一中学2025-2026学年高一上学期10月月考英语试题(解析版).docx
- 河南省TOP二十校205—2026学年高一上学期10月联考生物试题(原卷版).docx
- 河南省安阳市第一中学、鹤壁市高中、新乡市第一中学三校2025-2026学年高一上学期第一次联考数学试题(解析版).docx
- 河南省部分高中2025-2026学年高一上学期第二次月考数学试卷(解析版).docx
- 河南省百师联盟2025-2026学年高二10月联考数学试题(北师大版)(解析版).docx
- 河南省部分学校2025-2026学年高一上学期期中考试数学试题(解析版).docx
- 河南省部分重点中学2025~2026学年高二上学期10月末质量检测数学试题(解析版).docx
- 河南省部分重点中学2025-2026学年高二上学期10月末质量检测英语试题(解析版).docx
- 桥梁伸缩缝安装工艺(可编辑).pptx
最近下载
- 江苏省海安市八校2026届中考猜题数学试卷含解析.doc VIP
- 2026届江苏省海安市十校中考数学押题卷含解析.doc VIP
- 北森:2026年中国企业人力资源数智化成熟度模型与实践白皮书.pdf
- 《中国消化道黏膜下肿瘤内镜诊治专家共识(2023版)》解读课件课件.pptx VIP
- 莆田市2024-2025学年下学期七年级期末质量调研试卷数学(含答案).docx
- 《卷耳》原文与鉴赏.docx VIP
- 演出经纪实务-2025演出经纪人《演出市场政策与经纪实务》练习题.docx VIP
- 扬州某邮局办公楼暖通空调设计毕业设计(含图纸-双击图纸可调出CAD格式).pdf VIP
- 泌尿男生殖系感染宣讲.ppt
- 高清焓湿图超清分辨率.pdf VIP
原创力文档

文档评论(0)