- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
《数据挖掘与统计应用》教学大纲
课程编号:121063A
课程类型:□通识教育必修课□通识教育选修课
□学科基础课□专业核心课
?专业提升课□专业拓展课
总学时:48讲课学时:32实验(上机)学时:16
学分:3
考试类型:?考试?考查
适用对象:经济统计学统计学数学与应用数学(金融方向)专业
□是?否适合作为其他专业学生的个性化选修课
先修课程:统计学、计算机基础
一、教学目标
该课程是针对统计学院所有专业本科学生开设的,其特点是不以数学理论和推导为主,而是在学生了解数据挖掘的基本概念和基本理论的基础上,介绍典型数据挖掘方法的基本思路和算法,教会学生能够利用数据挖掘软件分析实际数据。本课程主要以国际通用权威数据挖掘软件为主要教学工具,以实际工作中的数据进行实训教学。达到的教学目标是:增强学生实际动手解决问题的能力,学会利用数据挖掘软件处理实际数据。
目标1:应用专业知识,解决数据分析问题
目标2:可以建立统计模型,获得有效结论
目标3:掌握统计软件及常用数据库工具的使用
目标4:关注国际统计应用的新进展
目标5:基于数据结论,提出决策咨询建议
目标6:具有不断学习的意识
目标7:培育有坚定理想信念、深厚爱国主义情怀、高尚道德情操,具有扎实统计专业学识,坚韧奋斗进取品格的社会主义新青年。
二、教学内容及其与毕业要求的对应关系
本课程重点讲授常用数据挖掘算法,包含联机数据分析与数据仓库、数据预处理、探索性数据分析、变量选择以及关联、聚类、分类、异常值侦测、时序等经典数据挖掘算法。其理论部分只介绍这些方法的基本思路与算法,授课的重点在于每一种挖掘算法,包括:每种算法的基本思路、应用前提、算法评判标准、软件的实现及输出结果的理解和解释,并能给出结论;介绍数据挖掘软件的应用,主要以一种数据挖掘软件并结合实际数据进行分析。以多媒体的课件讲授为主,同时上机,上机完成每种方法的练习。采用课堂练习和课后作业方式对学生掌握知识情况进行考核,建议采用开卷或论文方式进行课程考核,本课程平时成绩占30%,期末考试成绩占30%。
三、各教学环节学时分配
以表格方式表现各章节的学时分配,表格如下:
教学课时分配
序号
章节内容
讲课
实验
其他
合计
1
数据探索与预处理
4
2
?
6
2
模型结果评估
6
1
?
7
3
决策树
4
1
?
5
4
关联规则
6
1
?
7
5
聚类分析
3
1
?
4
6
Logistic回归
3
1
?
4
7
神经网络
4
1
?
5
8
数据挖掘软件介绍(SASEM)
6
4
?
10
合计
36
12
0
48
四、教学内容
第1章 数据探索与预处理
1.1 数据范围和分布标准化(了解)
1.2 数据可视化(了解)
1.3 缺失值插补(理解与掌握)
1.4 属性变量的处理(掌握)
1.5 变量的筛选(掌握)
课程思政切入点:通过探索数据,培养学生的探索精神。
第2章 模型结果评估
2.1 概述(了解)
2.2 分类规则评估面面观(理解)
2.3 误分率(掌握)
2.4 收益矩阵(掌握)
2.5 评估两分类的规则(掌握和应用)
2.6 评估多分类的规则(掌握和应用)
2.7 常用模型评估和比较准则(应用)
课程思政切入点:通过对错误分类细分中的两类错误分析,培养学生平衡对立矛盾的思想。
第3章 决策树
3.1 树的建模过程(理解)
3.2 树的常用算法(掌握)
3.3 树在数据挖掘中的应用(应用)
3.4 决策树案例分析(应用)
课程思政切入点:通过决策树的讲解,可以使学生进一步了解人类大脑进行决策的步骤。
第4章 关联规则
4.1 概述(了解)
4.2 市场购物篮分析(理解)
4.3 使用关联规则节点(了解)
4.4 理解关联规则(理解)
4.5 非二元变量的关联分析(掌握)
4.6 负关联分析 (掌握)
4.7 序列关联分析(理解)
4.8 关联规则案例分析(应用)
课程思政切入点:通过关联规则的学习,培养学生用联系的观点看待各种问题。
第5章 聚类分析
5.1 背景(了解)
5.2 距离度量(理解)
5.3 聚类方法(掌握)
5.4 变量聚类(理解)
5.5 实践中的考虑(了解)
5.6 聚类案例分析(应用)
课程思政切入点:通过聚类分析中差异度的讲解,培养学生对事物间差异进行度量的能力。
第6章 Logistic回归
6.1 传统Logistic回归简介(了解)
6.2 数据挖掘中Logit判别的其他考虑(了解)
6.3 logistic回归案例分析(掌握与应用)
课程思政切入点:通过对Logistic回归中风险最小化的分析,培养学生在实际工作学习和生活中管控风险的能力。
第7章 神经网络
7.1
您可能关注的文档
最近下载
- 《大学之道》《人皆有不忍人之心》(成语识记+挖空特训+情境默写+写作素材) 统编新教材高考语文课内古诗文【要点梳理与素材积累】.docx VIP
- 五年级道德与法治3,主动拒绝烟酒与毒品优秀教案.pdf
- 《美丽的丝巾ppt课件》小学美术浙人美版二年级下册_2.ppt
- 《论语十二章》(成语识记+挖空特训+情境默写+写作素材) 统编新教材高考语文课内古诗文【要点梳理与素材积累】.docx VIP
- 电动单梁起重机设计计算书.doc
- 2069-3-3101-002 WKB产品判定准则-外发.docx
- 露天矿组织架构、部门职责.pdf VIP
- 《数字化测图》课程标准(高职).docx
- 医疗行业医疗设备采购方案.docx VIP
- 朝阳市第四高中诗词大会十二宫格题.ppt
文档评论(0)