- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
课程编号:
《数据挖掘》
课 程 教 学 大 纲
吉 林 财 经 大 学
二○○五 年 八 月
《数据挖掘》课程教学大纲
一、课程基本信息
.课程编号:
.英文名称:
.课程模块:专业限选课
.课程学时:总计 学时,其中,实验(践) 学时
.学 分:
.先(预)修课程:概率与统计,数据库原理
.适用专业:计算机科学与技术、电子商务、信息管理与信息系统
.修订时间:
二、课程简介
数据挖掘是管理科学与信息工程学院开设的一门重要的专业限选课程。本课程主要讲授数据挖掘的基本概念,原理、方法和技术,具体包括:数据的预处理、分类预测、关联挖掘、聚类分析等内容。通过学习,使学生理解数据挖掘的基本流程,掌握数据挖掘的基本理论和技术,熟悉数据挖掘成果的表达;掌握数据挖掘的基本方法,能熟练地应用数据挖掘技术对现实数据进行有效的分析,能够结合软件从大量统计数据中获取有价值的信息。
三、课程教学目标
数据挖掘是高级数据处理和分析技术。通过本课程学习,使学生了解数据挖掘这种现代数据分析和知识挖掘方法的思想与技术,了解数据挖掘的基本理论,掌握重要的数据挖掘方法,掌握如何利用实现数据分析和挖掘,并使学生具有进一步学习的基础与能力。
四、教学内容与要求
第一章 数据挖掘和使用概述
【教学目的与要求】
本章作为绪论,其目的是让学生对数据挖掘技术有一个总体的认识。因此,主要内容是对数据挖掘技术的概念、产生背景、发展趋势以及应用等进行提炼和概括,并熟悉软件的使用环境。要求学生掌握以下内容:
数据挖掘的发展
数据挖掘基本知识
数据挖掘功能
数据挖掘应用
数据挖掘的热点问题
熟悉软件
【教学重点】
、数据挖掘概念
、数据挖掘分类
【教学难点】
、操作基础
【教学内容】
数据挖掘的产生背景
、数据挖掘产生的背景
、数据挖掘的发展
、数据挖掘概述
什么是数据挖掘
、数据挖掘概念
、数据挖掘分类
、数据挖掘体系结构
软件概述
、的配置
、操作基础
第二章 数据管理
【教学目的与要求】
本章中的数据管理主要是指数据挖掘中的数据预处理部分。对数据进行预处理,不但可以节约大量的空间和时间而且得到的挖掘结果能更好地起到决策和预测作用。 数据预处理一般包括:数据清理,数据集成,数据变换,数据归约等方法。要求学生掌握本章讲授的所有数据管理技术。
【教学重点】
、数据源节点()
、记录选项节点( )
、字段选项节点( )
【教学难点】
【教学内容】
数据源节点()
、从开放数据库中导入数据
、从文本文件中读取数据
、导入格式的数据
、用户手动创建数据
记录选项节点( )
、选择节点()
、对数据的抽样()
、修正数据集中的不均匀性()
、统计汇总()
、对节点数据的排序
、区分节点来清除重复记录
字段选项节点( )
、变量说明
、变量值的重新计算
、变量类别值的调整
、生成新变量
、变量值的离散化处理
、生成样本集分割变量
第三章 数据的基本描述分析
【教学目的与要求】
基本描述分析是数据分析的基础,通常对数值型变量进行描述分析,涉及数据的集中趋势和离散程度。描述集中趋势的描述性统计量一般有均值、中位数和众数;描述离散程度的描述性统计量一般有方差、标准差和极差。 要求学生掌握数据的基本分析方法。
【教学重点】
、数据质量探索
、数据基本描述分析
【教学难点】
、两分类变量相关性的研究
【教学内容】
数据质量探索
、数据的基本描述与质量探索
、离群点和极端值的修正
、缺失值的替补
、数据质量管理的其他功能
数据基本描述分析
、计算基本描述统计量
、绘制散点图
两分类变量相关性的研究
、两分类变量相关性的图形分析
、两分类变量相关性的数值分析
两总体的均值比较
变量重要性分析
第四章 关联规则挖掘
【教学目的与要求】
关联规则是形如→的蕴涵式,其中, 和分别称为关联规则的先导(或, )和后继(或, ) 。其中,关联规则→,存在支持度和信任度。
本章对关联规则挖掘中的概念、方法、算法进行全面的分析和讲解。由于关联规则挖掘是数据挖掘技术中研究最早、成果最多、相对比较成熟的分支,因此本章重点在于一些经典理论和算法、热点问题的介绍。要求学生掌握以下内容:
关联规则相关概念
算法
在中应用算法
【教学重点】
、关联规则相关概念
、算法
【教学难点】
、序列模式挖掘
【教学内容】
关联规则概述
、基本概念
、关联规则表示
、关联规则挖掘算法简介
算法
、算法生成频繁项集的过程
、算法从频繁项集产生关联规则
在中应用算法
序列模式挖掘
、序列与序列模式
、算法
、在中应用序列模式挖掘
第五章 分类与预测
【教学目的与要求】。
分类是指把数据样本映射到一个事先定义的类中的学习过程,即给定一组输入的属性向量及其对应的类,用基于归纳的学
原创力文档


文档评论(0)