- 5
- 0
- 约2.65万字
- 约 16页
- 2017-03-09 发布于贵州
- 举报
知识发现与管理 2 知识发现
知识发现与管理
2 知识发现
2.1概述基于数据库的知识发现 KDD 和数据挖掘还存在着混淆,通常这两个术语替换使用。KDD表示将低层数据转换为高层知识的整个过程。可以将KDD简单定义为:KDD是确定数据中有效的、新颖的、潜在有用的、基本可理解的模式的特定过程。而数据挖掘可认为是观察数据中模式或模型的抽取,这是对数据挖掘的一般解释。虽然数据挖掘是知识发现过程的核心,但它通常仅占KDD的一部分 大约是15%到25% 。因此数据挖掘仅仅是整个KDD过程的一个步骤,对于到底有多少步以及哪一步必须包括在KDD过程中没有确切的定义。然而,通用的过程应该接收原始数据输入,选择重要的数据项,缩减、预处理和浓缩数据组,将数据转换为合适的格式,从数据中找到模式,评价解释发现结果。KDD)是基于数据库的知识发现的简称(Knowledge Discovery in Databases),
2.1.2知识发现的基本任务
数据分类。分类是数据挖掘研究的重要分支之一,是一种有效的数据分析方法。分类的目标是通过分析训练数据集,构造一个分类模型 即分类器 ,该模型能够把数据库中的数据记录映射到一个给定的类别,从而可以l立用于数据预测。
数据聚类。当要分析的数据缺乏必要的描述信息,或者根本就无法组织成任何分类模式时,利用聚类函数把一组个体按照相似性归成若干类,这样就可以自动找到类。聚类和分类类似,都是将数据进行分组
原创力文档

文档评论(0)