- 5
- 0
- 约6.63千字
- 约 11页
- 2017-05-30 发布于湖北
- 举报
数据挖掘导论IrisKDD分析创新
`
题 目 iris数据集的 二〇 一六年 9月
iris数据集的知识发现(KDD:Knowledge Discovery in Database)是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识发现将信息变为知识,从数据矿山中找到蕴藏的知识金块,将为知识创新和知识经济的发展作出贡献。该术语于1989年出现,Fayyad定义为KDD是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程”。
KDD目的是利用所发现的模式解决实际问题,“被人”的模式帮助人们理解模式包含的信息,从而的评估和利用。核心作为一个KDD的工程而言,KDD通常包含一系列复杂的挖掘步骤. Fayyad,Piatetsky-Shapiro 和 Smyth 在 1996年合作发布的论文From Data Mining to knowledge discovery中总结出了KDD包含的5个最基本步骤(如图).
1: selection: 在第一个步骤中我们往往要先知道什么样的数据可以应用于我们的KDD工程中.
2: pre-processing: 当采集到数据后,下一步必须要做的事情是对数据进行预处理,尽量消除数据中存在
的错误以及缺失信息.
3: transformation: 转换数据为数据挖掘工具所需的格式.这一步可以使得结果更加
您可能关注的文档
最近下载
- 2026年新疆公务员《行测》考试真题_含答案版.pdf
- 2026年云南省公务员《行测》考试真题_含答案版.pdf
- 2026年重庆市公务员《行测》考试真题_含答案版.pdf
- 2026年内蒙古公务员《行测》考试真题_含答案版.docx
- 变电站值班员职业技能鉴定试题库题库(1544道).docx VIP
- 浙江省四校(含精诚联盟)2025-2026学年高一下学期3月阶段检测语文试卷(含答案).pdf VIP
- 2026年四川省公务员《行测》考试真题_含答案版.pdf
- 基于单片机的智能安防系统.docx VIP
- TB 10417-2018 铁路隧道工程施工质量验收标准.docx
- 爱尖子高一高二课程讲义合集.pdf VIP
原创力文档

文档评论(0)