Data Mining: Concepts and Techniques 知识发现的基本过程 数据库中的知识发现处理过程模型 知识发现软件或工具的发展 知识发现项目的过程化管理 从源数据中发现有用知识是一个系统化的工作。首先必须对可以利用的源数据进行分析,确定合适的挖掘目标。然后才能着手系统的设计和开发。 完成从大型源数据中发现有价值知识的过程可以简单地概括为:首先从数据源中抽取感兴趣的数据,并把它组织成适合挖掘的数据组织形式;其次,调用相应的算法生成所需的知识;最后对生成的知识模式进行评估,并把有价值的知识集成到企业的智能系统中。 一般地说,KDD是一个多步骤的处理过程,分为问题定义、数据抽取、数据预处理、数据挖掘 和模式评估等基本阶段。 问题定义阶段的功能 KDD是为了在大量数据中发现有用的令人感兴趣的信息,因此发现何种知识就成为整个过程中第一个也是最重要的一个阶段。 在问题定义过程中,数据挖掘人员必须和领域专家以及最终用户紧密协作 一方面了解相关领域的有关情况,熟悉背景知识,弄清用户要求,确定挖掘的目标等要求; 另一方面通过对各种学习算法的对比进而确定可用的学习算法。后续的学习算法选择和数据集准备都是在此基础上进行的。 数据抽取与集成 数据抽取与集成是知识发现的关键性工作。早期的数据抽取是依靠手工编程来实现的,现在可以通过高效的抽取工具来实现。即使是使用抽取工具,数
您可能关注的文档
- 第2章物理安全技术方案.ppt
- 第2章物理安全方案.ppt
- 第2章燃料及热力计算方案.ppt
- 第2章液压传动基础方案.ppt
- 第2章电力电子器件方案.ppt
- 第2章燃烧基础知识方案.ppt
- 第2章电动汽车的结构与原理分析方案.ppt
- 第2章物流保管方案.ppt
- 第2章直流电机的建模与特性(第2部分)方案.ppt
- 第2章直流电机的建模与特性方案.ppt
- 安全生产管理员能力培训.pptx
- 咽异感症与心理健康促进.pptx
- 咽异感症与扁桃体炎的鉴别.pptx
- 咽异感症与抑郁症的关系.pptx
- 咽异感症与环境污染的关系.pptx
- 《生动的数据》课件-2025-2026学年沪教版(新教材)小学美术三年级下册.pptx
- 《校园微电影宣传策划》教学课件-2025-2026学年人美版(北京)(2024)初中美术七年级下册.pptx
- 《 春华秋实绘花鸟》教学课件-2025-2026学年人美版(北京)(2024)初中美术七年级下册.pptx
- 管理层安全培训策略.pptx
- 《把“大自然”穿在身上》教学课件-2025-2026学年人美版(北京)(2024)初中美术七年级下册.pptx
最近下载
- 2026年省委党校在职研究生入学考试政治理论模拟试卷及答案(十一).docx VIP
- 市政管道闭水试验方案.pdf VIP
- 7 The Wicked Witch - 黑布林英语阅读系列《绿野仙踪》中英伴读.pdf VIP
- 癫痫护理课件下载.pptx
- 吉林省吉林市普通高中2024-2025学年高三下学期第四次模拟测试数学试题(解析).docx
- 2026年省委党校在职研究生入学考试政治理论模拟试卷及答案(十).docx VIP
- 2024武汉商学院辅导员招聘笔试真题.docx VIP
- 2026年省委党校在职研究生入学考试政治理论模拟试卷及答案(九).docx VIP
- 2026年省委党校在职研究生入学考试政治理论模拟试卷及答案(八).docx VIP
- 武汉商学院辅导员考试题库.pdf VIP
原创力文档

文档评论(0)