- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
                        查看更多
                        
                    
                《大数据技术综合实训2》教学大纲
一、课程基本
信息
课程名称
大数据技术综合实训
Comprehensive Actual Training Of Big Data Technology
课程编码
SCC320811030开课院部理学院
课程团队
数据科学团队
学分
3.0课内学时 3周|讲授|0实聆0上机
0|实践
3周课外学时0
适用专业
数据科学与大数据技术
授课语言
中文
先修课程
Python语言与实训、大数据技术基础实训
课程简介 (必修)
《大数据技术综合实训》是数据科学与大数据技术专业的一门必修课,通过本课程的实机操作,使学生掌握在本机与多台机器集群执 行Spark应用程序,并运用MLlih机器学习演算法进行数据处理、训练、建立模型、训练验证模型、预测结果。另外.以大数据实际案例 示范使用Spark ML Pipeline机器学习流程进行二元分类、多元分类、回归分析,将机器学习的每一个步骤建立成Pipel ine流程.通过 对Spark MLlib机器学习算法和应用案例的研究,进一步锻炼学生的动手能力.培养学生处理大数据问题的能力。
The Comprehensive Training of Big Data Technology is a compulsory course for the major of Data Science and Big Data Technology. Through the real-time operation of this course, students can master how to execute Spark application program with multiple machine clusters on their own, and use MLlib machine learning algorithm to process data, train, build mode 1s, train validation mode 1s and predict results. In addition, we use Spark MI. Pipeline machine learning process to carry out binary classification, multiple classification and regression analysis with large data examples, and build every step of machine learning into Pipeline process. Through the study of Spark MLlib machine learning algorithm and application cases, the students practical ability is further trained and their ability to deal with big data problems is trained.
负责人
大纲执笔人
审核人
二 课程目标
序号
代号
课程目标
0BE
毕业要月
R指标点
任务
自选
1
Ml
目标1 :掌握在本机与多台机器集群执行Spark应用程序.系统掌握大数据技术的实验方法,培养学 生实践实验技能
是
3.2
2
M2
目标2 :运用Spark YLlib和Spark ML Pipel ine机器学习流程进行二元分类、多元分类、回归分 析,能够量化分析问题,具备分析和建立大数据模型的能力
是
3.2, 4.2
3
M3
目标3:通过对Spark迎lib机器学习算法和应用案例的研究,进一步锻炼学生的团队协作能力,培 养创新精神.训练创新思维,培育创新创业实践能力、科学研究能力和技术开发能力
是
7. 2, 8. 1, 8.2
4
Ml
目标4 :能保障课程正常秩序(政治层面、课堂保障层面.非学生能力层面)
否
三、il
程内容
序号
章节号
标题
课程内容/重难点
支撑课 程目标
课内 学时
教学方式
课外
学时
课外环节
1
第1章
第1章Spark的 介绍与安装
本章重点难点:不同模式下运行spark程序
/
/
2
1. 1
1. 1 Spark的介绍 与安装
Spark的介绍与安装
Ml
0. 25 天
讲授、讨 论
/
/
3
1.2
1. 2运行spark程 序与 Spark Web
UI界面
本地运行spark程序、在Hadoop YARN运行spark、构建Spark Standalone Cluster 运行环境、在 Spark Standalone 运行 spark x Spark
                您可能关注的文档
- 《识字8》 第二课时 教学设计.docx
- 《植物生长素的发现》教学设计.docx
- 《机械制造技术》.课程教学大纲.docx
- 《文献检索与网络资源利用》课程教学大纲.docx
- 《数字编码》教案.docx
- 《建筑表现技巧》课程教学大纲.docx
- 《工程管理概论》课程教学大纲.docx
- 《器乐演奏5》课程教学大纲.docx
- 《命若琴弦》教案正文.docx
- 《储蓄存款和商业银行》教案.docx
- 2026年试验检测师之交通工程考试题库300道【必考】.docx
- 2026年国家电网招聘之人力资源类考试题库300道及参考答案.docx
- 2026年试验检测师之交通工程考试题库300道及一套答案.docx
- 2026年注册安全工程师题库300道附完整答案【全国通用】.docx
- 2026年试验检测师之交通工程考试题库300道附参考答案(夺分金卷).docx
- 2026广东能源集团管道有限公司、惠州天然气开发公司、云浮云考前自测高频考点模拟试题(浓缩300题).docx
- 2026年刑法知识考试题库200道及答案参考.docx
- 2026四川广安安农发展集团有限公司第二批次招聘12人考前自测高频考点模拟试题(浓缩300题)推荐.docx
- 2026年试验检测师之交通工程考试题库300道及答案(名校卷).docx
- 受助学生感谢信(精选15篇).docx
最近下载
- 《SL 386-2016 水利水电工程边坡设计规范》.pdf
- 航海学2罗经差的测定.ppt VIP
- 造价咨询服务质量承诺及保证措施.pdf VIP
- 四部医典-中国国家图书馆.PDF VIP
- 尚硅谷大数据技术之spark913spark06内核解析.pdf VIP
- BS EN 451-2-2017 粉煤灰试验方法第2部分:湿法筛分细度的测定.pdf VIP
- 一级造价师《建设工程造价案例分析(水利工程)》真题卷(2025年新版专业解析).pdf VIP
- 2025年全国《宪法》知识竞赛试题题库及答案.docx VIP
- 低压开关柜检验报告.doc VIP
- 北师大选择性必修一Contribution and Sacrifice优质课比赛一等奖.pptx VIP
 原创力文档
原创力文档 
                        

文档评论(0)