数据挖掘复习提纲.docVIP

  • 16
  • 0
  • 约 9页
  • 2017-08-27 发布于安徽
  • 举报
《数据挖掘》复习提纲 第一章 数据挖掘概述 1、什么是数据挖掘 从大量数据中挖掘有用的知识 数据挖掘的动机 数据丰富,信息贫乏 3、数据挖掘的同义词 从数据中挖掘知识,知识提炼,数据/模式分析,数据考古,数据捕捞、信息收获、资料勘探等等 知识发现的过程 1.数据清理2.数据集成3.数据选择4.数据变换5.数据挖掘6.模式评估7.知识表示 5、数据挖掘和知识发现是一回事吗? 数据挖掘是知识发现过程的一个步骤 6、数据挖掘可以挖掘的两类模式? 描述性的数据挖掘,预测性的数据挖掘 7、常用的数据挖掘技术? 概念/类描述: 特性化和区分,挖掘频繁模式、关联和相关,分类和预,聚类分析,离群点(孤立点)分析,趋势和演变分析 什么是离群点?离群点总是被抛弃的吗? 离群点:一些与数据的一般行为或模型不一致的孤立数据。 通常孤立点被作为“噪音”或异常被丢弃,但在欺骗检测中却可以通过对罕见事件进行孤立点分析而得到结论 挖掘的所有模式都是有趣的吗?什么样的模式是有趣的?如何度量模式的有趣度? 一个数据挖掘系统/查询可以挖掘出数以千计的模式, 并非所有的模式都是有趣的 易于理解,在某种必然程度上,对于新的或检验数据是有效的,是潜在有用的,是新颖的,符合用户确信的某种假设 客观: 基于模式的统计和结构, 例如, 支持度, 置信度, 等.主观: 基于用户对数据的确信, 例如, 出乎意料, 新颖性, 可行动性等

文档评论(0)

1亿VIP精品文档

相关文档