- 2
- 0
- 约1.11千字
- 约 49页
- 2018-11-29 发布于江苏
- 举报
深入浅出spark培训
深入浅出Spark;目录;;Spark的发展历程;Spark特点;Spark整体架构;目录;Spark组件
Driver Program
(驱动程序) 是Spark 的核心组件
构建SparkContext(Spark应用的入口,它负责和整个集群的交互,创建需要的变量,还包含集群的配置信息等)
将用户提交的job转换为DAG图(类似数据处理的流程图)
根据策略将DAG图划分为多个stage,根据分区从而生成一系列tasks
根据tasks要求向资源管理器申请资源
提交任务并检测任务状态
Executor
真正执行task的单元,一个Worker Node上可以有多个Executor;Spark端到端流程;Driver运行在Client;Spark on YARN;目录;核心模块;核心模块——RDD整体介绍;作用于RDD上的Operation分为转换(transformantion)和动作(action)。 Spark中的所有“转换”都是惰性的,在执行“转换”操作,并不会提交Job,只有在执行“动作”操作,所有operation才会被提交到cluster中真正的被执行。这样可以大大提升系统的性能。;核心模块——RDD持久化;核心模块——RDD依赖关系;核心模块——RDD依赖关系;核心模块——RDD容错机制;核心模块——Scheduler整体介绍;核心模块——Schedul
您可能关注的文档
最近下载
- 基于STM32的智能语音助手.doc VIP
- 2025年乳制品工业产业政策(〔009年修订.docx VIP
- 如何编制高质量的招标工程量清单与招标控制价.doc VIP
- 31、《做最勇敢的自己》.pptx VIP
- 2025年江苏省苏州工业园区初三一模化学试题及答案.pdf VIP
- 江苏省南通市如皋市2024-2025学年高一下学期教学质量调研(二)数学试题.pdf VIP
- 2025年湖北省工程技术职务水平能力测试(土地管理)历年参考题库含答案详解.docx VIP
- 水电运维管理员考试题库.docx VIP
- 武汉市武昌区2025-2026学年第二学期五年级语文期中考试卷(部编版含答案).docx VIP
- 反谐振空芯光纤:理论、仿真与制备的深度剖析.docx VIP
原创力文档

文档评论(0)