数据挖掘课程复习提纲new.pdfVIP

  • 14
  • 0
  • 约3.72万字
  • 约 23页
  • 2017-08-27 发布于安徽
  • 举报
数据挖掘课程复习提纲(计算机、软件、网络) 有关考试 题型: 一、填空题(20 分,每题2 分) 二、判断题(10 分,每题1 分) 三、计算题(40 分,每题10 分)——分类、聚类、关联分析、异常挖掘各一题 四、问答题(30 分,每题10 分) 基本要求:掌握数据预处理、分类、聚类、关联分析、异常挖掘的基本方法,及每 类方法的应用场景(每类方法理解、熟悉一个例子)。算法重点掌握k-means、DBSCAN、 ID3(C4.5)、Bayes、KNN、Appriori 及基于距离、密度、聚类的异常检测方法。 第一章 绪论 1 数据挖掘的定义 技术层面:数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据 中,提取隐含在其中、人们事先不知道的、但又潜在有用的信息和知识的过程。 商业层面:数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量 业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。 2 数据挖掘的任务 预测任务:根据其它属性的值预测特定(目标)属性的值,如回归、分类、异常检测。 描述任务:寻找概括数据中潜在联系的模式,如关联分析、演化分析、聚类分析、序列模 式挖掘。 (1

文档评论(0)

1亿VIP精品文档

相关文档