- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
PAGE2
**学院
《大数据分析技术》课程教学大纲
(课程类别:理论课(含课内实践))
课程基本信息
课程名称
大数据分析技术
BigdataAnalysisTechnology
课程代码
0600084
课程性质
?必修£选修
课程类型
£思想政治理论课£通识课程
£专业基础课程?专业核心课程
£专业方向(选修)课程£集中性实践课程
£创新创业与劳动教育课程£通识扩展课程
考核方式
£考试?考查
适用专业
数据科学与大数据技术
开课单位
数学与计算机学院
开课学期
第4学期
学时学分
学分:2
总学时:48
理论学时:16
实践学时:32
先修课程
数学分析、高等代数、概率论与数理统计、Python程序设计
二、课程简介(性质、内容、任务)
性质:《大数据分析技术》是应用统计学专业的一门专业核心课。
内容:本课程主要介绍数据预处理、无监督学习、有监督学习(回归、分类)和深度学习五个模块的数据分析理论及实践,对应有数据预处理、插值与拟合、回归分析(一元和多元、线性和非线性)、logistic回归、树结构模型(决策树、随机森林、轻梯度提升机器)、支持向量机、聚类分析(模糊c均值聚类、kmeans++、KNN)、特征降维(PCA、ICA、t-SNE)、复杂网络分析及基于pytorch的深度学习(经典神经网络、深度神经网络)等数据分析技术。
任务:通过本课程的学习,学生可以了解数据的价值及数据分析的重要性,掌握数据预处理、机器学习、深度学习等数据分析技术,具备数据建模、python编程、应用统计、数据分析报告撰写等能力。
三、课程目标
本课程的任务是通过课堂教学和实验教学,使学生获得数据科学与大数据技术领域的基本知识,提高学生分析和解决大数据价值挖掘方面问题的能力,支撑专业学习成果中相应指标点的达成。
通过本课程学习,预期学生可以具备以下知识、技能或素养:
课程目标1(L01):熟练掌握和运用数据预处理的基本原理、基本概念、基本知识对原始数据进行数据清洗、数据集成、缺失项(及重复项、奇异项)数据的发现与处理、数据变换(标准化、归一化、离散化、编码)、数据规约等一系列操作,原始数据经预处理后成为数据成品,保存于数据仓库进行分类和管理,备后续应用。(开启数据分析第一个步骤)
课程目标2(L02):掌握监督学习方法的基本原理、基本概念和基本知识,熟练运用插值、拟合、回归分析、树结构模型、支持向量机等技术进行数据建模,进而完成数据预处理、因果推断、趋势预测、特征重要性评估等分析任务,并对模型精确性进行有效评估。
课程目标3(L03):掌握无监督学习的基本原理、基本概念和基本知识,熟练运用聚类分析、特征降维等技术进行数据建模,进而完成样本归类、标准模式库的建立等分析任务,并对模型精确性进行有效评估,对降维效果进行可视化。
熟练运用复杂网络分析相关知识完成社交网络、互联网搜索、信用评估和风险控制、交通流量管理、流行病学研究等领域的数据分析任务,挖掘网络中的超级节点和社区结构。
课程目标4(L04):理解神经网络的概念,并能延伸理解深度学习的概念。熟练运用神经网络和深度学习知识建立数据分析模型,完成因果推断、趋势预测等任务。
课程目标
支撑毕业要求指标点及指标内涵
支撑毕业要求指标点及贡献度(H/M/L)
L01
2-3对原始数据进行预处理:数据集成、数据清洗、数据变换及数据归约,并对预处理完成的数据进行有效管理以备后用。
2-3/M
L02
3-3能熟练运用有监督机器学习相关方法和原理进行数据预处理、因果推断和趋势预测等分析,并能对模型精确性进行评估,能对模型进行统计检验。
3-3/H
L03
3-3能熟练运用无监督机器学习相关方法和原理进行聚类分析、特征降维和复杂网络分析,并能对聚类模型精确性进行评估。
3-3/H
L04
5-1能运用深度学习相关方法和原理进行图像分类、目标检测、文本分类等分析。
5-1/H
(说明:将通用标准中的毕业要求指标点及指标内涵与本专业知识和能力相结合进行描述;H-高支撑、M-中支撑、L-低支撑)
教学内容及要求
教学单元一:数据预处理
学时:9其中实验学时:6
支撑课程目标:4、5
主要内容
填写说明:某一单元包含的主要内容,不写章节,可逐项列出。须包含思政融入点、教学重难点。
内容
思政融入点
重点
难点
数据集成
培养“数据是战略资源”意识,树立加强数据管理、数据安全观念
数据集成的概念
数据集成的Python实现
数据清洗
数据清洗的概念
数据清洗的Python实现
数据变换
数据变
文档评论(0)