第2章知识发现过程与应用结构(new)方案.ppt

Data Mining: Concepts and Techniques 知识发现的基本过程 数据库中的知识发现处理过程模型 知识发现软件或工具的发展 知识发现项目的过程化管理 从源数据中发现有用知识是一个系统化的工作。首先必须对可以利用的源数据进行分析,确定合适的挖掘目标。然后才能着手系统的设计和开发。 完成从大型源数据中发现有价值知识的过程可以简单地概括为:首先从数据源中抽取感兴趣的数据,并把它组织成适合挖掘的数据组织形式;其次,调用相应的算法生成所需的知识;最后对生成的知识模式进行评估,并把有价值的知识集成到企业的智能系统中。 一般地说,KDD是一个多步骤的处理过程,分为问题定义、数据抽取、数据预处理、数据挖掘 和模式评估等基本阶段。 问题定义阶段的功能 KDD是为了在大量数据中发现有用的令人感兴趣的信息,因此发现何种知识就成为整个过程中第一个也是最重要的一个阶段。 在问题定义过程中,数据挖掘人员必须和领域专家以及最终用户紧密协作 一方面了解相关领域的有关情况,熟悉背景知识,弄清用户要求,确定挖掘的目标等要求; 另一方面通过对各种学习算法的对比进而确定可用的学习算法。后续的学习算法选择和数据集准备都是在此基础上进行的。 数据抽取与集成 数据抽取与集成是知识发现的关键性工作。早期的数据抽取是依靠手工编程来实现的,现在可以通过高效的抽取工具来实现。即使是使用抽取工具,数

文档评论(0)

1亿VIP精品文档

相关文档