- 10
- 0
- 约1.03万字
- 约 20页
- 2019-06-07 发布于北京
- 举报
Adaptive Execution 让 Spark SQL 更智能更高效
1 背景
前面《Spark SQL / Catalyst 内部原理 与 RBO》与《Spark SQL 性能优化再进一步 CBO 基于代价的优化》介绍的优化,从查询本身与目标数据的特点的角度尽可能保证了最终生成的执行计划的高效性。但是
执行计划一旦生成,便不可更改,即使执行过程中发现后续执行计划可以进一步优化,也只能按原计划执行
CBO 基于统计信息生成最优执行计划,需要提前生成统计信息,成本较大,且不适合数据更新频繁的场景
CBO 基于基础表的统计信息与操作对数据的影响推测中间结果的信息,只是估算,不够精确
本文介绍的 Adaptive Execution 将可以根据执行过程中的中间数据优化后续执行,从而提高整体执行效率。核心在于两点
执行计划可动态调整
调整的依据是中间结果的精确统计信息
2 动态设置 Shuffle Partition
2.1 Spark Shuffle 原理
Spark Shuffle 一般用于将上游 Stage 中的数据按 Key 分区,保证来自不同 Mapper (表示上游 Stage 的 Task)的相同的 Key 进入相同的 Reduc
您可能关注的文档
- 10个“天南地北”的小故事 反思大数据 .doc
- 10个必须收藏的PHP代码样例 .doc
- 10大行业大数据应用痛点及解决策略 .doc
- 10步带你认识大数据和云计算,走出懵逼圈 .doc
- 12个顶级大数据工具 .doc
- 13张图看6年来数据科学概念之争 .doc
- 16个用于数据科学和机器学习的顶级平台 .doc
- 19个让你得到真正回报的大数据认证 .doc
- 2011年LSI紧抓SAS力战固态存储 .doc
- 2017全球TOP10数据科学公司榜单出炉 .doc
- JJF(石化)081-2023乙醇气体检测报警器校准规范.pdf
- 计量规程规范 JJF(石化)081-2023乙醇气体检测报警器校准规范.pdf
- 计量规程规范 JJF(石化)086-2023恒温振荡培养箱校准规范.pdf
- 《JJF(石化)086-2023恒温振荡培养箱校准规范》.pdf
- JJF(石化)097-2023橡胶压缩屈挠试验机校准规范.pdf
- JJF(石化)084-2023润滑油蒸发损失测定仪(诺亚克法)校准规范.pdf
- 《JJF(石化)102-2023撞击感度试验仪校准规范》.pdf
- JJF(石化)102-2023撞击感度试验仪校准规范.pdf
- 计量规程规范 JJF(石化)102-2023撞击感度试验仪校准规范.pdf
- 计量规程规范 JJF(石化)070-2023气体和蒸气点燃温度测定仪校准规范.pdf
最近下载
- 全媒体运营(AIGC 版)课件全套 项目1--8 全媒体运营概述 ---全媒体运营管理.pptx
- 25 同步讲义:《从百草园到三味书屋》新课预习-小升初语文衔接(学生版).docx VIP
- 全媒体运营基础知识.docx VIP
- 2021四川省用水定额.docx VIP
- 2025CSCO胃癌诊疗指南.pptx VIP
- 2026年最新风电土建考试试题及答案.docx VIP
- 兴义民族师范专升本旅游学概论第七版试卷及答案.docx VIP
- 《Arduino开发技术及应用》高职PPT完整全套教学课件.pptx
- 《基于人因工程的轿车舒适性评价研究》-毕业设计(论文).doc VIP
- 列表法在方程中的应用-初中-数学-论文.pdf VIP
原创力文档

文档评论(0)