- 4
- 0
- 约1.34万字
- 约 15页
- 2019-03-18 发布于湖北
- 举报
多用户mapreduce集群的作业调度
一、简介
Hadoop MapReduce和它的开源实现最初优化大型批作业如web索引结构。然而,另一个用例近期显现:在多个用户之间共享一个MapReduce集群,它运行的长批处理作业、短交互式查询共享一个公共数据集。使统计复用,相比于为每组构建私有集群成本更低。分享一个集群也会导致数据整合(主机托管不同的数据集)。这避免了昂贵的跨私有集群复制的数据,并允许一个组织在不相交的查询数据集高效地运行。
我们的工作最初是出于MapReduce工作负载在Facebook,主要的网络目的地运行Hadoop数据仓库。事件日志从Facebook的网站被导入到Hadoop集群每小时,在那里他们被用于各种各样的应用程序,包括分析使用模式来改进网站设计、检测垃圾邮件,数据挖掘和广告优化。仓库600台机器上运行,存储500 TB的压缩数据,这是每天2 TB速度增长。除了“生产”工作,必须定期运行,有很多实验工作,从几个小时机器学习几天计算到1 - 2分钟即席查询提交通过SQL接口Hadoop称为蜂房[3]。
当Facebook开始建造数据仓库,它发现提供数据整合共享集群大有益处。例如,一位工程师在垃圾邮件检测时可以在任意数据源寻找规律,比如朋友列表和广告点击,来识别垃圾邮件发送者。然而,当足够的组织开始使用Hadoop,工作响应时间开始遭受Hadoop的FIFO
您可能关注的文档
- 对赣南采茶模拟性动作的成因分析.doc
- 对监理、对施工方安全交底.doc
- 对解决山区小路上运输问题的一种设想.docx
- 对象的建立与数据操作.doc
- 对象的序列化存储:Serializable和Parceable.docx
- 对于童话教学的点滴思考.doc
- 对照式议论文写作指导与训练.doc
- 墩台身施工方案、方法(实心、空心墩).docx
- 墩柱技术交底.doc
- 墩柱式桥墩施工方案.doc
- 假睫毛佩戴后的卸除注意事项.pptx
- 《编码的使用与安全》教案-2025-2026学年湘教版(新教材)小学信息技术四年级下册.docx
- 《编写活动中的参赛码》教案-2025-2026学年湘教版(新教材)小学信息技术四年级下册.docx
- 3.12 不同的歌声——民族文化与美术 教学设计 高中美术湘美版(2019)美术鉴赏(1).docx
- 《程序也是编码》教案-2025-2026学年湘教版(新教材)小学信息技术四年级下册.docx
- 《电波加密语》教案-2025-2026学年湘教版(新教材)小学信息技术四年级下册.docx
- 《二进制—计算机唯一能识别的编码》教案-2025-2026学年湘教版(新教材)小学信息技术四年级下册.docx
- 《生活中的常见编码》教案-2025-2026学年湘教版(新教材)小学信息技术四年级下册.docx
- 《体验并创建二维码》教案-2025-2026学年湘教版(新教材)小学信息技术四年级下册.docx
- 7.4 跨学科实践:调研桥梁建筑中的力平衡(沪科版2024)八年级物理教材.docx
最近下载
- 2025年新疆中考生物试卷真题(含答案).pdf
- “互联网现代农业”的经营思维与创新路径.docx VIP
- 距骨骨折的治疗.pptx VIP
- 企业环境保护管理制度(标准).pdf VIP
- 2024第48届世赛江苏省选拔赛化学实验室技术项目技术文件.doc VIP
- 2024年新疆中考生物试题卷(含答案详解).docx
- 医疗药品CE技术资料EP17-A2 Evaluation of Detection Capability for Clinical Laboratory Measurement Procedure.pdf VIP
- 高分辨率食测压的临床应用.ppt VIP
- 江苏凤凰新华书店集团有限公司招人笔试题库2026指南.pdf
- 江苏2026年高考物理最后冲刺押题试卷及答案(共二十套)新版.docx
原创力文档

文档评论(0)