- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数据挖掘》教学大纲
课程类别:专业任选修课程 课程名称:数据挖掘
开课单位:理学院 课程编号:总学时:40 学 分:4
适用专业:统计学专业
先修课程:概率论、数理统计、多元统计分析等
一、课程在教学计划中地位、作用
数据挖掘是20世纪末刚刚兴起的数据智能分析技术,由于有广阔的应用前景而备受重视。数据挖掘作为一门新兴的学科,在它的形成和发展过程中表现出了强大的生命力,广大从事数据科学和统计科学的科研工作者和工程技术人员迫切需要了解和掌握它。数据挖掘自产生以来就是以分析数据、理解数据的实际需求为推动力的,其研究发展也逐步渗透到工业、农业、医疗卫生和商业的实际需求当中。数据挖掘涉及的内容较为广泛,已成为迅速发展并在信息社会中广泛应用的一门综合性学科。数据挖掘已成为计算机、统计学专业的一门重要课程,也是从事相关研究和应用人员必须掌握的重要知识。
二、课程目标
通过本课程的实验教学,使学生具备下列能力:
(1)全面而深入地掌握数据挖掘的基本概念和原理,了解模型精度的评价方法。
(2)深入地掌握线性回归分析及模型的改进与评价,掌握各种分类方法以及对其进行比较。能够对实际数据进行分类模型的建立,具有比较各方法的能力。
(3)通过学习关联分析、社交网络分析以及文本挖掘,能够对实际数据进行处理、分析,并建立解释合理的统计模型。
三、课程内容及基本要求
第一章 数据挖掘概述
1、理解和掌握数据挖掘的基本概念、数据挖掘过程以及数据挖掘功能;
2、了解数据挖掘的应用和面临的问题;
3、对数据挖掘能够解决的问题和解决问题思路有清晰的认识。
第二章 数据探索
1、了解数据的导入与导出;
2、了解单变量数据的探索方法;
3、了解多变量数据的探索方法;
4、掌握图表的意义以及数据的描述统计。
第三章 回归分析
1、理解多元线性回归模型的确定方法以及模型的检验方法;
2、理解基于树的回归分析方法;
3、了解非线性回归方法。
第四章 分类
1、了解分类及预测的基本思想、概念和意义;
2、掌握逻辑斯蒂回归,掌握线性判别分析,了解非线性判别分析;
3、了解分类方法的比较。
第五章 聚类分析
1、了解聚类分析的基本思想、概念和意义;
2、 掌握相似度(或相异度)的常用度量方法;
3、 掌握常用的聚类算法,包括K-Means、SOM 、BIRCH、DBSCAN、STING;
4、了解孤立点分析的三类方法;了解其它方法的内容;了解聚类分析的研究动态。
第六章 关联规则
1、了解关联规则的基本思想、概念和意义;
2、了解关联规则挖掘的应用背景;
3、掌握常用的关联规则算法,包括Apriori、GRI、Sequence Detection;
4、了解关联规则挖掘的研究动态。
第七章 文本挖掘
1、了解文本挖掘的基本思想、概念和意义;
2、掌握常用的文本挖掘的软件包,了解分词方法,掌握词项-文档矩阵的建立方法。
3、能够进行词频统计分析以及词项聚类;
3、能够利用文本挖掘工具对实际文本数据进行建模分析。
第八章 社交网络分析
1、了解社交网络分析的基本思想、概念和意义;
2、了解社交网络分析的应用背景;
3、掌握社交网络分析方法。
第九章 综合案例分析
1、了解数据挖掘课程所学内容,能够利用所学统计模型建立合适的回归方程;
2、了解关联规则和社交网络分析在商品销售中应用;
四、学时分配
章节名称
讲授(学时)
实验(学时)
小计
第一章 数据挖掘概述
2
0
2
第二章 数据探索
2
0
2
第三章 回归分析
8
0
8
第四章 分类
4
0
4
第五章 聚类分析
4
0
4
第六章 关联规则
4
0
4
第七章 文本挖掘
6
0
6
第八章 社交网络分析
4
0
4
第九章 综合案例分析
6
0
6
合计
40
0
40
五、课程目标达成评价的途径和措施
本课程通过“平时成绩”、 “综合数据分析答辩成绩”两种方式对课程目标达成进行评价,考核成绩计算公式如下(本大纲中成绩均采用百分制):
考核成绩 = 平时成绩30% +综合数据分析答辩成绩70%
平时成绩 = 出勤成绩
1.平时成绩
平时成绩给定方法如下表所示:
序号
出勤次数
成绩
1
20
100
2
19
90-95
3
18
80-85
4
17
70-75
5
16
60-65
6
15
50-55
7
14
40-45
4
小于等于13
0
在课堂
您可能关注的文档
- 指数函数、对数函数、函数的图像与性质.doc
- 指数函数与对函数经典讲义.doc
- 指导大学生创新创业练计划项目工作总结.doc
- 指数函数、对数函数、幂数增长比较.pptx
- 指数函数与对函数高考题及答案.docx
- 指数函数、对数函数幂函数练习题大全(答案).doc
- 招贴设计_第章_历史.ppt
- 拜耳公司产串烧.ppt.ppt
- 指数函数和对数数练习题.doc
- 指数函数及对数函数知点及习题.docx
- 2026河北银行校园招聘备考题库附答案详解(完整版).docx
- 2026建银工程咨询有限责任公司福建分公司秋季校园招聘1人备考题库含答案详解(巩固).docx
- 2026广发银行韶关分行校园招聘备考题库及答案详解(典优).docx
- 2026杭州银行总行信息技术部校园招聘备考题库附答案详解(完整版).docx
- 2026徽商银行淮北分行综合支行主要负责人招聘备考题库含答案详解(基础题).docx
- 2026建信住房租赁私募基金管理有限公司校园招聘4人备考题库含答案详解(精练).docx
- 2026年度秋季中国工商银行远程银行中心校园招聘68人备考题库附答案详解(达标题).docx
- 2025湖北恩施州巴东县纪委监委机关选调工作人员6人笔试备考题库及答案解析(夺冠).docx
- 河北高频考点专题:圆中求阴影部分的面积.ppt
- 2025西北工业大学计算机学院陕西省嵌入式系统技术重点实验室非事业编制人员招聘1人考试历年真题汇编附.docx
最近下载
- CECS302-2011 乡村建筑外墙板应用技术规程.docx VIP
- CECS438-2016 住宅卫生间建筑装修一体化技术规程.docx VIP
- CECS455-2016 应急电源系统施工及验收规程.docx VIP
- 注塑模具运行确认记录表(1).docx VIP
- DLT 598-2010 电力系统自动交换电话网技术规范.docx VIP
- 民宿酒店运营管理实务操作手册.docx VIP
- KRONES润滑资料概要1.ppt VIP
- 新教科版二年级上册科学期末测试卷通用.docx VIP
- 容器-Kubernetes认证管理员CKA培训教材.pdf
- 医疗纠纷预防和处理条例(完整版).pptx VIP
原创力文档


文档评论(0)