Spark核心技术原理透视一(Spark运行原理)-加米谷大数据在大数据领域,只有深挖数据科学领域,走在学术前沿,才能在底层算法和模型方面走在前面,从而占据领先地位。Spark的这种学术基因,使得它从一开始就在大数据领域建立了一定优势。无论是性能,还是方案的统一性,对比传统的Hadoop,优势都非常明显。Spark提供的基于RDD的一体化解决方案,将MapReduce、Streaming、SQL、Machine Learning、Graph Processing等模型统一到一个平台下,并以一致的API公开,并提供相同的部署方案,使得Spark的工程应用领域变得更加广泛。本文主要分以下章节:一、Spark专业术语定义二、Spark运行基本流程三、Spark运行架构特点四、Spark核心原理透视一、Spark专业术语定义1、Application:Spark应用程序指的是用户编写的Spark应用程序,包含了Driver功能代码和分布在集群中多个节点上运行的Executor代码。Spark应用程序,由一个或多个作业JOB组成,如下图所示:2、Driver:驱动程序Spark中的Driver即运行上述Application的Main()函数并且创建SparkContext,其中创建SparkContext的目的是为了准备Spark应用程序的运行环境。在Spark中由SparkContext
您可能关注的文档
最近下载
- 2023年颈椎病中西医结合诊疗专家共识学习与解读.docx VIP
- 2026年全国高压电工证理论考试题库(含答案).docx
- 2024年杭州市萧山区招录高学历事业人员考试真题.docx VIP
- 叉车安全驾驶技术.pptx VIP
- 广东省深圳市龙岗区2024-2025学年七年级下学期语文期末学业质量测试试卷(含答案).pdf VIP
- 2025年长沙市天心区辅警招聘考试试题题库附答案解析.docx VIP
- 石油钻井工程监督手册.ppt
- DMTO工艺C4馏分年产9万吨2-丙基庚醇项目.pptx VIP
- 1-制动的基础理论-现代城市轨道交通车辆制动系统的主要功能和组成部分.ppt VIP
- 样本风冷热泵模块机组.pdf VIP
原创力文档

文档评论(0)