spark调度管理原理讲义.ppt

下载文档 降价啦

11
0
约2.39千字
约 24页
2017-02-14 发布于湖北
举报
版权申诉
保障服务

spark调度管理原理讲义.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

spark调度管理原理讲义

Spark调度管理原理 Spark调度管理原理 Spark程序得以运转的核心是它的调度管理逻辑，在Spark底层物理资源调度到上层应用。处于核心位置的作业调度管理模块是整个程序运作的枢纽。 4.1 Spark作业调度管理概述在Spark作业调度系统中，调度的前提是判断多个作业任务的依赖关系，这些作业任务之间可能存在因果的依赖关系。适合用DAG有向无环图来表示。在作业调度的相关类中，最重要的就是DAGScheduler（基于DAG图的调度类）。 TaskScheduler负责每个具体任务的实际物理调度，DAGScheduler负责将作业拆分成不同阶段的具有依赖关系的多批任务，可以理解为DAGScheduler负责任务的逻辑调度。 4.2 Spark调度的相关基本概念 Task（任务）：单个分区数据集上的最小处理流程单元。 TaskSet （任务集）：由一组关联的，但相互之间没有Shuffle依赖关系的任务所组成的任务集。 Stage（调度阶段）：一个任务集对应的调度阶段。 Job（作业）：由一个或多个调度阶段所组成的一次计算作业。 Application（应用程序）：Spark应用程序，由一个或多个作业组成。 4.3 作业调度模块顶层逻辑概述在Spark应用程序中，用户代码基本是基于RDD的一系列计算操作。在实际运行时，这些计算操作是延迟执行的，并不是所有的RDD操作都会触发Spark向集群提交实际作业，只有一些需要返回数据或者向外部输出数据的操作才会触发实际的计算工作，其他的变换操作只是生成对应的RDD关系链，用来记录依赖关系和所需执行的运算。 DAGScheduler最重要的任务之一就是计算作业和任务的依赖关系，制定调度逻辑。DAGScheduler中作业调度的发起，对外暴露的两个主要的入口其中之一是submitJob，另一个是runJob。两者的区别在于前者返回一个Jobwaiter对象，可以用在异步调用中，用来判断作业完成或者取消作业，而后者则在内部调用submitJob，阻塞等待直到作业完成（或失败）。 4.3 作业调度模块顶层逻辑概述 DAGScheduler在SparkContext初始化的过程中被实例化，一个SparkContext对应创建一个DAGScheduler。 DAGScheduler在初始化过程中会创建一个DAGSchedulerEventProcessActor实例来处理各种DAGSchedulerEvent事件，这些事件包括作业的提交、任务状态的变化、监控等，如程序4-2所示，DAGSchedulerEventProcessActor的Receive函数是DAGScheduler中处理这些事件的入口，可以看到各种待处理的事件。 4.3 作业调度模块顶层逻辑概述 4.3 作业调度模块顶层逻辑概述 eventProcessActor是DAGScheduler的私有成员，通过DAGScheduler封装好的公共函数接口间接地向eventProcessActor发送相关消息，如在前面提到的submitJob，如程序4-3所示。 4.3 作业调度模块顶层逻辑概述 DAGScheduler内部维护了各种“任务/调度阶段/作业”的状态和相互之间的映射关系表，用于在任务状态更新、集群状态更新等各种情况下，正确的维护作业的运行逻辑。 4.4 作业调度具体工作流程每个作业从提交到完成，都要经历多个步骤，拆分成以任务为最小单位，按照一定的逻辑依赖关系依次提交执行，并返回结果。 4.4 作业调度具体工作流程 4.4.1 调度阶段的拆分 4.4.1 调度阶段的拆分 4.4.1 调度阶段的拆分以GroupByKey操作为例，该操作返回的结果实际上是一个ShuffleRDD，当DAGScheduler遍历到这个ShuffleRDD的时候，因为其依赖关系是一个ShuffleDependency，于是这个ShuffleRDD的父RDD以及ShuffleDependency等对象就被用来构建一个新的Stage，这个Stage的输出结果的分区方式，则由ShuffleDependency 中的Partitioner对象决定。尽管划分和构建Stage的依据是ShuffleDependency，在前面的例子中对应的RDD是ShuffleRDD，但是这个Stage所处理的数据是从这个ShuffleRDD的父RDD开始的，只是最终的输出结果位置信息参考了ShuffleRDD返回的ShuffleDependency里所包含的内容。而ShuffleRDD本身的运算操作，是在下一个Stage里进行的。下面以pagerank的程序4-5为例说明