- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
;Spark模块;Spark模块; Spark模块包含:Spark Core、Spark SQL、Spark Streaming、Spark MLlib、集群管理器。
;模块详解; 一、Spark Core
实现了Spark的基本功能,包含任务调度、内存管理、错误恢复、与存储系统交互等模块。Spark Core中还包含了对弹性分布式数据集(Resilient Distributed DataSet,简称RDD)的API定义; 二、Spark SQL
提供SQL处理能力,便于熟悉关系型数据库操作的工程师进行交互查询。此外,还为熟悉 Hive 开发的用户提供了对 Hive SQL 的支持。; 三、Spark Streaming
提供流式计算处理能力,目前支持 Apache Kafka、Apache Flume、Amazon Kinesis 和简单的 TCP 套接字等多种数据源。此外,Spark Streaming 还提供窗口操作用于对一定周期内的流数据进行处理。; 四、MLlib
Spark 提供的机器学习库。MLlib 提供了机器学习相关的统计、分类、回归等领域的多种算法实现,具有一致的 API 接口。; 五、集群管理器
Spark 设计为可以高效地在一个计算节点到数千个计算节点之间伸缩计算。为了实现这样的要求,同时获得最大灵活性,Spark支持在各种集群管理器(Cluster Manager)上运行,包括Hadoop YARN、Apache Mesos,以及Spark自带的一个简易调度器,叫作独立调度器(Standalone);1.Spark模块2.模块详解
您可能关注的文档
- Spark技术发展历程.pptx
- Spark技术模块简介.pptx
- Spark技术流式处理模块.pptx
- Spark技术流式处理模块特性与原理.pptx
- Spark技术流式处理模块简介.pptx
- 二零二三年 优质公开课Spark技术简介.pptx
- 二零二三年 优质公开课Spark是什么.pptx
- 二零二三年 优质公开课Spark架构模型.pptx
- 二零二三年 优质公开课Spark生态介绍.pptx
- 二零二三年 优质公开课Spark生态介绍2.pptx
- 2024年新疆阿克苏地区企业人力资源管理师之一级人力资源管理师考试题库大全及参考答案(综合卷).docx
- 2024年新疆哈密地区企业人力资源管理师之一级人力资源管理师考试真题题库含答案AB卷.docx
- 2024年新疆喀什地区企业人力资源管理师之一级人力资源管理师考试题库(基础题).docx
- 2024年新疆喀什地区企业人力资源管理师之一级人力资源管理师考试【原创题】.docx
- 2024年新疆博尔塔拉蒙古自治州企业人力资源管理师之四级人力资源管理师考试精选题库及答案【精选题】.docx
- 2024年新疆阿克苏地区企业人力资源管理师之一级人力资源管理师考试含答案(实用).docx
- 2024年新疆塔城地区企业人力资源管理师之四级人力资源管理师考试精品题库及答案(必刷).docx
- 2024年教师年终个人述职报告范文(4篇) .pdf
- 2024年新疆乌鲁木齐市企业人力资源管理师之一级人力资源管理师考试精品题库带答案(达标题).docx
- 2024年新疆塔城地区企业人力资源管理师之一级人力资源管理师考试大全附答案【培优】.docx
文档评论(0)