- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE1 / NUMPAGES4
大数据处理
Dig Data Process
课程代码 学分:2
学时: 32 (其中:课堂教学学时:32实验学时: 上机学时: 课程实践学时: )
先修课程:概率统计与数理统计、线性代数
适用专业:工商管理
教材:数据科学导论:Python语言实现、(意)阿尔贝托·博斯凯蒂(Alberto Boschetti),(意)卢卡·马萨罗(Luca Massaron)著,于俊伟,靳小波译、机械工业出版社、2016年8月第1版
一、课程性质与课程目标
(一)课程性质(需说明课程对人才培养方面的贡献)
《大数据处理》是工商管理专业选修课,它建立在概率论、数理统计等课程知识的基础上,以大数据分析和挖掘所涉及的关键要素为主要内容,系统讲解大数据分析与数据挖掘所涉及到的工具、方法、模型以及可视化等知识,为社会培养具有大数据分析与数据挖掘能力的专业技术人才。
(二)课程目标(根据课程特点和对毕业要求的贡献,确定课程目标。应包括知识目标和能力目标。)
1.掌握大数据挖掘的工具与流程;
2.掌握常用的机器学习模型及其应用;
3.掌握大数据科学的可视化方法;
注:工程类专业通识课程的课程目标应覆盖相应的工程教育认证毕业要求通用标准;
(三)课程目标与专业毕业要求指标点的对应关系(认证专业专业必修课程填写)
课程目标
毕业要求指标点
目标1
目标2
目标3
目标4
注:课程目标与毕业要求指标点对接的单元格中可输入“?”,也可标注“H、M、L”。
二、课程内容与教学要求(按章撰写)
第一章 绪论
(一)课程内容
(1)大数据科学与Python;(2)Python安装与配置;(3)Notebook使用
(二)教学要求
(1)了解大数据处理与Python的关系;(2)掌握Python的安装与配置;(3)初步了解Notebook的使用
(三)重点与难点(若不单独列出,需在教学要求中适当注明)
1. 重点
掌握Python环境的安装与配置。
2. 难点
深刻理解大数据的含义及对能力的要求。
第二章 数据预处理
(一)课程内容
(1)大数据处理过程;(2)使用pandas进行数据加载与预处理
(二)教学要求
(1)处理问题数据;(2)处理大数据集;(3)数据预处理;(4)数据选择
(三)重点与难点(若不单独列出,需在教学要求中适当注明)
1. 重点
数据预处理的方法和过程。
2. 难点
处理大数据集。
第三章 特征工程
(一)课程内容
(1)特征创建;(2)降维;(3)异常检测和处理;(4)评分函数;(5)交叉验证;(6)超参数优化;(7)特征选择
(二)教学要求
(1)特征工程的类型及特点;(2)掌握特征工程的处理方法
(三)重点与难点(若不单独列出,需在教学要求中适当注明)
1. 重点
特征工程的方法。
2. 难点
超参数优化及特征选择。
第四章 机器学习
(一)课程内容
(1)线性和逻辑回归;(2)朴素贝叶斯;(3)K近邻;(4)SVM;(5)自然语言处理
(二)教学要求
(1)掌握常用机器学习算法及应用;(2)掌握自然语言处理的流程和方法
(三)重点与难点(若不单独列出,需在教学要求中适当注明)
1. 重点
机器学习。
2. 难点
自然语言处理。
第五章 社会网络分析
(一)课程内容
(1)图论简介;(2)图的算法;(3)图的加载、输出和采样
(二)教学要求
(1)图的基本理论;(2)图的算法和应用
(三)重点与难点(若不单独列出,需在教学要求中适当注明)
1. 重点
图算法。
2. 难点
基于图进行网络分析。
第六章 可视化
(一)课程内容
(1)matplotlib绘图;(2)pandas应用;(3)数据学习表示
(二)教学要求
(1)了解数据可视化方法;(2)掌握实际问题中的可视化解决方案设计
(三)重点与难点(若不单独列出,需在教学要求中适当注明)
1. 重点
数据可视化方法。
2. 难点
学习曲线、验证曲线。
三、本课程开设的实验项目(如课程不含实验,该项可不填)
编号
实验项目名称
学时
类型
要求
支撑的课程目标
1
2
……
注:1. “类型”填验证性、综合性、设计性等;
2. “要求”填必做、选做。
实验1:(实验名称)
写明实验目标及要求。
实验2:(实验名称)
写明实验目标及要求。
……
四、学时分配及教学方法
章
(按序填写)
教学形式及学时分配
主要教学方法
支撑的课程目标
课堂教学
实验
上机
课程实践
小计
第一章
4
案例教学
目标
文档评论(0)