Spark编程基础教学大纲.pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

Spark编程基础教学大纲

课程内容包括大数据技术概述、Scala语言基础、Spark的设计与运行原理、

Spark环境搭建和使用方法、RDD编程、SparkSQL、SparkStreaming和SparkMLlib

等。

课程概述

Spark是当前热门的大数据处理技术,本课程重点介绍Spark的技术原理与

编程方法。课程由全国高校知名大数据教师厦门大学林子雨老师主讲,采用林子

雨等编著的《Spark编程基础(Scala版)》作为课程教材。Spark支持采用Scala、

Java、Python和R语言进行编程,本课程采用Scala语言编写Spark应用程序。

课程内容包括大数据技术概述、Scala语言基础、Spark的设计与运行原理、Spark

环境搭建和使用方法、RDD编程、SparkSQL、SparkStreaming和SparkMLlib等。

通过本课程的学习,将帮助学生形成基础的Spark应用程序编程能力,为学生使

用Spark技术解决实际科研问题和未来从事大数据相关工作奠定基础。

授课目标

Spark是当前热门的大数据处理技术,本课程重点介绍Spark的技术原理与

编程方法。本课程采用Scala语言编写Spark应用程序。课程内容包括大数据技

术概述、Scala语言基础、Spark的设计与运行原理、Spark环境搭建和使用方法、

RDD编程、SparkSQL、SparkStreaming和SparkMLlib等。通过本课程的学习,

将帮助学生形成基础的Spark应用程序编程能力,为学生使用Spark技术解决实

际科研问题和未来从事大数据相关工作奠定基础。

课程大纲

第1章大数据技术概述

1.1大数据时代

1.2大数据概念

1.3大数据的影响

1.4大数据关键技术

1.5大数据计算模式

1.6代表性大数据技术

第1章大数据技术概述单元测验

第2章Scala语言基础

2.1Scala语言概述

2.2Scala基础知识

2.3面向对象编程基础

2.4函数式编程基础

第2章Scala语言基础单元测验

第3章Spark的设计与运行原理

3.1Spark概述

3.2Spark生态系统

3.3Spark运行架构

3.4Spark的部署和应用方式

第3章Spark的设计与运行原理单元测验

第4章Spark环境搭建和使用方法

4.1安装Spark

4.2在spark-shell中运行代码

4.3开发Spark独立应用程序

4.4Spark集群环境搭建

4.5在集群上运行Spark应用程序

第4章Spark环境搭建和使用方法单元测验

第5章RDD编程

5.1RDD编程基础

5.2键值对RDD

5.3数据读写

5.4综合案例

第5章RDD编程单元测验

第6章SparkSQL

6.1SparkSQL简介

6.2DataFrame

6.3从RDD转换得到DataFrame

6.4使用SparkSQL读写数据库

第6章SparkSQL单元测验

第7章SparkStreaming

7.1流计算概述

7.2SparkStreaming

7.3DStream操作概述

7.4基本输入源

7.5高级数据源

7.6转换操作

7.7输出操作

7.8StructuredStreaming

第7章SparkStreaming单元测验

第8章SparkMLlib

8.1SparkMLlib简介

8.2机器学习流水线

8.3特征抽取、转化和选择

8.4分类与回归

第8章SparkMLlib单元测验

预备知识

本课程属于“进阶级”大数据课程,在学习本课程之前,建议首先学习由林

子雨老师主讲的“入门级”大数据课程《大数据技术原理与应用》(点击这里在

中国大学MOOC平台学习林子雨老师主讲的国家精品在线开放课程《大数据技

术原理与应用》)。《Spark编程基础》和《大数据技术原理与应用》两门课程之间,

在内容上实现了“无缝隙衔接”,可以帮助大数据学习者顺利完成入门学习和进

阶学习。

需要具备的预备知识包括:面向对象编程(比如Java)、数据库、操作系统、大

文档评论(0)

梁学玉 + 关注
官方认证
文档贡献者

中专学生

认证主体宁夏三科果农牧科技有限公司
IP属地宁夏
统一社会信用代码/组织机构代码
91640500MABW4P8P13

1亿VIP精品文档

相关文档