当前研究热点 (5) 突破MapReduce 计算模型的局限性:深入分析MapReduce 计算模型内在的局限性,考虑如何改进或扩展MapReduce. 比如提高MapReduce 系统的容错性 改善MapReduce 系统任务调度的方法 超越MapReduce 的局限性,实现更为有效的 并行计算模型 * 当前研究热点 Washington 大学的研究人员对MapReduce 框架进行了扩展,使之能够有效地支持迭代式并行程序的执行 * 当前研究热点 (6) 关系数据库和MapReduce 混合技术研究: 如上文所述,关系数据库和MapReduce 技术 各有优缺点,如何融合关系数据库和MapReduce 技术,设计同时具备两者优点的技术架构(既有MapReduce 的高度扩展性和容错性,又有RDBMS 的高性能),也是大数据分析技术的研究趋势 * 总结 面对大数据深度分析的挑战,关系数据库技术的扩展性遇到了前所未有的困难 同时,SQL 的表达能力不足以进行复杂深入的数据分析 * 总结 MapReduce 技术具有简洁的模型、良好的扩展性、容错性和并行性,随着其性能的不断改进和分析能力的不断增强(与R,Weka 的结合等),在大数据分析的技术竞争中异军突起 关系数据库技术和MapReduce 技术相互竞争、相互学习和相互渗透,促进了数据分析新生态系统的浮现 * 总结 在新生态系统中,关系数据库技术和MapReduce 技术找到了自己的位置,发挥出各自的优势,从大数据中分析和发现有用的知识 * Barcelona 超级计算中心和IBM Watson 实验室的研究人员研究了任务联合调度 * RDBMS 和MapReduce 技术的竞争与相互渗透 RDBMS 与MapReduce 的特点比较 * RDBMS 和MapReduce 技术的竞争与相互渗透 MIT 的研究人员借鉴MapReduce 的容错思想,试图在Shared Nothing 架构的并行数据库系统上实现更高的容错性能,取得良好的容错和负载均衡效果. * RDBMS 和MapReduce 技术的竞争与相互渗透 HadoopDB是试图混合MapReduce 和RDBMS 技术的一项重要工作 在HadoopDB 中,系统清晰地分成两层,上层使用Hadoop 进行任务的分解和调度,下层用RDBMS(Postgresql)进行数据的查询和处理 * RDBMS 和MapReduce 技术的竞争与相互渗透 HadoopDB的创新之处是: 试图利用Hadoop 的任务调度机制提高系统的扩展性和容错性,以解决大数据分析的横向扩展问题; 利用RDBMS 实现数据存储和查询处理,以解决性能问题.在其性能实验中,HadoopDB 的性能仍然落后于关系数据库系统. * RDBMS 和MapReduce 技术的竞争与相互渗透 Yale 大学Abadi 领导的小组正在使用包括列存储、持续装载和分析等技术,以改进HadoopDB 的性能 * RDBMS 和MapReduce 技术的竞争与相互渗透 Greenplum(已被EMC收购)和Aster Data(已被TERADATA收购)是两家新兴的面向大数据分析的公司,他们采用的策略是在MPP 架构的并行数据库里内置地支持MapReduce,其核心引擎同时作为MapReduce 作业的执行引擎 * RDBMS 和MapReduce 技术的竞争与相互渗透 两家公司正在进行一项重要的工作,即对分析函数进行MapReduce 风格的并行化.通过并行化,数据分析函数的执行性能大幅提升. 通过引进MapReduce 计算模型的思想,对传统的并行数据库进行改造,两家公司的MPP 架构的并行数据库系统可以轻松扩展到几百个节点的规模. * RDBMS 和MapReduce 技术的竞争与相互渗透 Aster Data 更是在2010 年中发布了超过30 个的分析软件包,提供上千个可以定制的分析函数,这些函数都将以并行的方式运行在MPP 平台上,从而在性能上大大超越传统的RDBMS 用户自定义函数(UDF). * RDBMS 和MapReduce 技术的竞争与相互渗透 随着MapReduce 技术性能的提升、应用领域的扩展,关系数据管理技术和MapReduce 技术的争论一直持续着. * RDBMS 和MapReduce 技术的竞争与相互渗透 2010 年初,ACM 通讯杂志同时向Stonebraker以及Google 的Dean 进行约稿 Dean 指出,MapReduce是进行大规模数据分析处理的灵活而有效的工具; 而Stonebraker 则从最初的对MapReduce 技术的彻
您可能关注的文档
- 大客户关系营销.ppt
- 大客户一站式解决方案(CRM).doc
- 大块头有大智慧日本独特的相扑文化(组图).doc
- 大理农村电商发展的难点和破冰.ppt
- 大力推进国家移动电子商务试点示范工程.doc
- 大力推进中央企业信息化.docx
- 大连金州新区金石滩小学 薛花英语教案b10m6-1_we'll see lots of big.doc
- 大连理工大学机械设计制造及其自动化专业.doc
- 大连市XXXX年初中毕业升学信息技术加试方案doc-关于.doc
- 大连市小学信息技术课程培训资料.doc
- 统编版2025年春季新版七年级下册历史 第21课 明清时期的科技与文化 教案.docx
- 雅安雨城法院书记员招聘考试真题库2025.docx
- 2026届安徽合肥市高考一模高考语文试卷试题(含答案详解).pdf
- 【专题研究】国内外城市更新研究的最新进展.pdf
- 【专题研究】老旧城区改造居民满意度影响因素研究——以遂宁市老旧城区改造为例.pdf
- 【专题研究】关于旧城空间改造理论与创意设计案例的几点思考.pdf
- 西藏拉萨市高三下学期期末物理备考重点详解.docx
- 泾县法院书记员招聘笔试真题2025.pdf
- 2026年春【苏教版】-六年级数学下册-面积的变化.pptx
- 2026年春【苏教版】-六年级数学下册-7.pptx
最近下载
- DB54∕T 0446-2025 民用建筑太阳能应用技术规程.pdf
- 快意电梯CTRL20-V101(小机房)电气原理图.pdf VIP
- 2023注册消防工程师(消防安全技术实务)题库含答案【基础题】.docx
- 2025年南京市中考物理试卷(含答案及解析).pdf VIP
- 中级注册安全工程师考试题库精编.docx
- 2019_昆仑通态_用户手册_G系列_7072Gi_V1.5.pdf VIP
- 慢性阻塞性肺疾病查房【优质公开课】精品PPT课件模板.pptx
- 2023注册消防工程师(消防安全技术实务)题库带答案(黄金题型).docx
- 2023年06月国家国防科技工业局核技术支持中心社会招考聘用笔试历年难、易错考点试题含答案解析.docx
- 机械制图习题集(第3版)非机类_杨慧英课后习题答案.docx
原创力文档

文档评论(0)