- 6
- 0
- 约3.28千字
- 约 5页
- 2016-12-05 发布于重庆
- 举报
數据仓库与数据挖掘学习要点及答案
数据仓库与数据挖掘学习要点
引言
数据挖掘的概念,即什么是数据挖掘?
数据挖掘--从大量数据中寻找其规律的技术,是统计学、数据库技术和人工智能技术的综合。2、数据挖掘的过程。
数据挖掘的功能是什么?即可以挖掘到什么类型的模式。
1)概念描述: 特征和区分 2)频繁模式,关联 3)分类和预测 4)聚类分析 5)离群点分析 6)趋势和演变分析
4、数据挖掘模式是要挖掘有趣的模式。什么是有趣模式,为什么要挖掘有趣的模式?
有趣模式:易于被人理解的, 在某种程度上在新的或测试数据上是有效的, 潜在有用的, 新颖的, 或验证了用户希望证实的某种假设
模式兴趣度度量,无论是客观的还是主观的,都可以用来指导发现过程
关系数据库、数据仓库、数据挖掘构成一个怎样的层次,在功能上它们之间有什么样的关系?
多种挖掘功能的集成、耦合
数据预处理
为什么要预处理数据?
现实世界中的数据是脏的:1)不完全: 缺少属性值, 缺少某些有趣的属性, 或仅包含聚集数据
2)噪音: 包含错误或孤立点
3)不一致: 编码或名字存在差异
数据预处理包括那些方面?
数据清理——填充缺失值, 识别/去除离群点, 光滑噪音, 并纠正数据中的不一致
数据集成——多个数据库, 数据立方体, 或文件
原创力文档

文档评论(0)