- 3
- 0
- 约1.05万字
- 约 83页
- 2016-08-23 发布于重庆
- 举报
数据仓库第七章
第七章 概念描述 7.1 概念描述基本知识 7.2 数据概化与基于汇总的特征化 7.3 解析特征化—属性相关分析 7.4 挖掘概念比较—区分不同的类 第七章 概念描述(续) DB中存放大量细节性数据,而用户通常希望以简洁的描述形式观察汇总的数据集。这种描述可提供某类数据的概貌以及与其他数据类的区别。此外,用户希望方便灵活地以不同的粒度和从不同的角度描述数据集。这种描述性数据挖掘称为概念描述,它是数据挖掘的一个重要部分。 7.1 概念描述基本知识 概念:通常指数据的汇集。 概念描述:是描述式数据挖掘最基本形式,它以简洁汇总的形式描述给定数据集,提供数据的有趣的一般特性。 7.1 概念描述基本知识(续) 概念描述的组成: 特征化:提供了一个有关数据整体的简洁清晰描述。(定性描述) 比较:提供了基于多组不同类数据的对比概念描述。(对比定性描述) 7.1 概念描述基本知识(续) 概念描述与数据概化密切相关。给定存放在DB中的大量数据,能够以简洁的形式在更一般的抽象层描述数据是很有用的。允许数据集在多个抽象层概化,便于考察数据的一般行为。 这种多维,多层数据概化类似于DW中的多维数据分析。而概念描述类似于DW的OLAP。 7.1 概念描述基本知识(续) 大型数据库的概念描述和数据仓库的OLAP有何差别? 概念描述可处理复
原创力文档

文档评论(0)