数据挖掘课复习提纲(终稿).docVIP

  • 10
  • 0
  • 约2.09万字
  • 约 26页
  • 2016-12-13 发布于贵州
  • 举报
数据挖掘课程复习提纲(10计算机、软件、网络) 有关考试 题型: 一、填空题(15分,每空1分) 二、判断题(10分,每题1分) 三、计算题(55分,4大题,1~3大题各15分,第4大题10分)——聚类、分类、关联分析、异常挖掘各一题 四、问答题(20分,3题,分别是7分,6分,和7分题) 基本要求:掌握数据预处理、分类、聚类、关联分析、异常挖掘的基本方法、clementine的基本使用方法,及每类方法的应用场景(每类方法理解、熟悉一个例子)。算法重点掌握k-means、一趟聚类、DBSCAN、ID3(C4.5)、Bayes、KNN、Apriori及基于距离、密度、聚类的异常检测方法。 第一章 绪论 1 数据挖掘的定义 技术层面:数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中、人们事先不知道的、但又潜在有用的信息和知识的过程。 商业层面:数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。 2 数据挖掘的任务 预测任务:根据其它属性的值预测特定(目标)属性的值,如回归、分类、异常检测。 描述任务:寻找概括数据中潜在联系的模式,如关联分析、演化分析、聚类分析、序列模式挖掘。 (1) 关联(Association)分析 关联分析,发现特征之间的相互

文档评论(0)

1亿VIP精品文档

相关文档