数据挖掘:概念与技术
韩家炜
Data Mining: Concepts and Techniques
J. Han and M. Kamber
Morgan Kaufmann
2000
目录
第一章 引言 8
1.1 什么激发数据挖掘?为什么它是重要的? 8
1.2 什么是数据挖掘? 10
1.3 数据挖掘——在何种数据上进行? 12
1.3.1 关系数据库 13
1.3.2 数据仓库 14
1.3.3 事务数据库 16
1.3.4 高级数据库系统和高级数据库应用 16
1.4 数据挖掘功能——可以挖掘什么类型的模式? 18
1.4.1 概念/类描述:特征和区分 19
1.4.2 关联分析 19
1.4.3 分类和预测 20
1.4.4 聚类分析 20
1.4.5 局外者分析 21
1.4.6 演变分析 21
1.5 所有模式都是有趣的吗? 21
1.6 数据挖掘系统的分类 22
1.7 数据挖掘的主要问题 23
1.8 总结 25
习题 26
第二章 数据仓库和数据挖掘的 OLAP 技术 29
2.1 什么是数据仓库? 29
2.2.1 操作数据库系统与数据仓库的区别 30
2.1.2 但是,为什么需要一个分离的数据仓库 31
2.2 多维数据模型 32
2.2.1 由表和电子数据表到数据方 32
2.2.2 星形、雪花和事实星座:多维数据库模式 34
2.2.3 定义星形、雪花和事实星座的例子 36
2.2.3 度量:它们的分类和计算 37
2.2.5 引入概念分层 38
2.2.6 多维数据模型上的 OLAP 操作 40
2.2.7 查询多维数据库的星形网查询模型 42
2.3 数据仓库的系统结构 42
2.3.1 数据仓库的设计步骤和结构 42
2.3.2 三层数据仓库结构 44
2.3.3 OLAP 服务器类型:ROLAP 、MOLAP 、HOLAP 的比较 45
2.4 数据仓库实现 46
2.4.1 数据方的有效计算 47
2.4.2 索引 OLAP 数据 50
2.4.3 OLAP 查询的有效处理 52
2.4.4 元数据存储 53
2.5 数据方技术的进一步发展 54
2.5.1 数据方发现驱动的探查 54
2.5.2 多粒度上的复杂聚集: 多特征方 56
2.5.3 其它进展 57
2.6 由数据仓库到数据挖掘 58
2.6.1 数据仓库的使用 58
2.6.2 由联机分析处理到联机分析挖掘 59
2.7 总结 60
习题 61
第三章 数据预处理 64
3.1 为什么要预处理数据? 64
3.2 数据清理 66
3.2.1 遗漏值 66
3.2.2 噪音数据 66
3.3 数据集成和变换 68
3.3.1 数据集成 68
3.3.2 数据变换 69
3.4 数据归约 70
3.4.1 数据方聚集 71
3.4.2 维归约 72
3.4.3 数据压缩 73
3.4.4 数值归约 75
3.5
您可能关注的文档
最近下载
- 2025年山东力明科技职业学院单招语文测试试卷大全.docx VIP
- 高考物理机械能常用模型最新模拟题精练专题31机械能+弹簧连接体+计算题(原卷版+解析).docx VIP
- 2025年湖南铁路科技职业技术学院单招职业技能考试题库及参考答案1套.docx
- 高考物理真题5年分类汇编专题10磁场(全国通用)(含解析).docx VIP
- 2025年成都七中自主招生物理试题 .pdf VIP
- 2025年城市管理协管员招聘考试(城市管理执法)历年参考题库含答案详解.docx VIP
- 保安服务方案 投标方案(技术标).doc
- 2024-2025学年人教版九年级上册化学期末专项训练:计算题(含解析).pdf VIP
- 【泰国投资促进委员会(BOI)】2025年投资促进项目申请指南.docx
- 陕西省09计价规则.pdf VIP
原创力文档

文档评论(0)