数据挖掘导论Iris KDD分析.docVIP

  • 5
  • 0
  • 约6.63千字
  • 约 11页
  • 2017-05-30 发布于湖北
  • 举报
数据挖掘导论IrisKDD分析创新

` 题 目 iris数据集的 二〇 一六年 9月 iris数据集的知识发现(KDD:Knowledge Discovery in Database)是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识发现将信息变为知识,从数据矿山中找到蕴藏的知识金块,将为知识创新和知识经济的发展作出贡献。该术语于1989年出现,Fayyad定义为KDD是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程”。 KDD目的是利用所发现的模式解决实际问题,“被人”的模式帮助人们理解模式包含的信息,从而的评估和利用。核心作为一个KDD的工程而言,KDD通常包含一系列复杂的挖掘步骤. Fayyad,Piatetsky-Shapiro 和 Smyth 在 1996年合作发布的论文From Data Mining to knowledge discovery中总结出了KDD包含的5个最基本步骤(如图). 1: selection: 在第一个步骤中我们往往要先知道什么样的数据可以应用于我们的KDD工程中. 2: pre-processing: 当采集到数据后,下一步必须要做的事情是对数据进行预处理,尽量消除数据中存在 的错误以及缺失信息. 3: transformation: 转换数据为数据挖掘工具所需的格式.这一步可以使得结果更加

文档评论(0)

1亿VIP精品文档

相关文档