數据仓库与数据挖掘学习要点及答案.docVIP

  • 6
  • 0
  • 约3.28千字
  • 约 5页
  • 2016-12-05 发布于重庆
  • 举报

數据仓库与数据挖掘学习要点及答案.doc

數据仓库与数据挖掘学习要点及答案

数据仓库与数据挖掘学习要点 引言 数据挖掘的概念,即什么是数据挖掘? 数据挖掘--从大量数据中寻找其规律的技术,是统计学、数据库技术和人工智能技术的综合。2、数据挖掘的过程。 数据挖掘的功能是什么?即可以挖掘到什么类型的模式。 1)概念描述: 特征和区分 2)频繁模式,关联 3)分类和预测 4)聚类分析 5)离群点分析 6)趋势和演变分析 4、数据挖掘模式是要挖掘有趣的模式。什么是有趣模式,为什么要挖掘有趣的模式? 有趣模式:易于被人理解的, 在某种程度上在新的或测试数据上是有效的, 潜在有用的, 新颖的, 或验证了用户希望证实的某种假设 模式兴趣度度量,无论是客观的还是主观的,都可以用来指导发现过程 关系数据库、数据仓库、数据挖掘构成一个怎样的层次,在功能上它们之间有什么样的关系? 多种挖掘功能的集成、耦合 数据预处理 为什么要预处理数据? 现实世界中的数据是脏的:1)不完全: 缺少属性值, 缺少某些有趣的属性, 或仅包含聚集数据 2)噪音: 包含错误或孤立点 3)不一致: 编码或名字存在差异 数据预处理包括那些方面? 数据清理——填充缺失值, 识别/去除离群点, 光滑噪音, 并纠正数据中的不一致 数据集成——多个数据库, 数据立方体, 或文件

文档评论(0)

1亿VIP精品文档

相关文档