数据挖掘知识点理.docVIP

  • 21
  • 0
  • 约8.54千字
  • 约 14页
  • 2016-04-17 发布于贵州
  • 举报
第一章 数据挖掘的概念及其特点 数据挖掘 概念:在大量的数据中挖掘感兴趣的知识(规则,规律,模式,约束) 数据挖掘 (从数据中发现知识) 特点:从大量的数据中挖掘哪些令人感兴趣的、有用的、隐含的、先前未知的和可能有用的模式或知识 挖掘的不仅仅是数据(所以“数据挖掘”并非一个精确的用词) 数据挖掘的核心(KDD)是什么? 知识挖掘(KDD) 数据挖掘与知识发现 从KDD对数据挖掘的定义中可以看到当前研究领域对数据挖掘的狭义和广义认识 数据清理: (这个可能要占全过程60%的工作量) 数据集成 数据选择 数据变换 数据挖掘(选择适当的算法来找到感兴趣的模式) 模式评估 知识表示 数据挖掘的体制结构。 数据挖掘的主要方法(能够区分)常用模式 分类预测的说明:比如:按气候将国家分类,按汽油消耗定额将汽车分类 导出模型的表示: 判定树、分类规则、神经网络 可以用来预报某些未知的或丢失的数字值 聚类分析的说明:例:对WEB日志的数据进行聚类,以发现相同的用户访问模式 孤立点分析的说明 (应用)信用卡欺诈检测/移动电话欺诈检测/客户划分/医疗分析(异常) 第二章 数据仓库的概念(特点就在概念里) 数据仓库是一个(1)面向主题的、(2)集成的、(3)随时间而变化的、(4)不容易丢失的数据集合,支持管理部门的决策过程. OLAP(联机分析处理)和OLTP(联机事务处理)的区别 1、

文档评论(0)

1亿VIP精品文档

相关文档