第一章数据挖掘概述讲述.ppt

第一章数据挖掘概述讲述

2. 机器学习 Simon对学习的定义是:”如果一个系统能够通过执行某种过程而改进它的性能. 这就是学习” 目前常用的机器学习方法 (1)决策树 决策树是一种分类方法,起源于概念学习系统。有名的决策树方法有ID3,C4.5 ,还有CART和Assistant. 决策树构造的输入是一组带有类别标记的数据,构造的结果是一棵二叉或多叉树。树中节点可分为两类:决策节点和叶子节点。 年龄? 信用等级? 学生? YES NO YES NO YES 否 是 30--40 〉40 〈30 一般 良好 购买电脑的分类模型 (2) ??? 遗传算法 遗传算法是一种新的优化技术,基于生物进化的概念设计了一系列的过程来达到优化的目的。这些过程有基因组合、交叉、变异和自然选择。 遗传算法可用于分类等问题的求解,最大的优点是效率高(适合用并行算法),但有过早收敛的缺点. (3)? 关联分析 关联规则和时序分新 关联规则是由R.Agrawal等1993年提出的,表示数据库中一组对象之间某种关联关系的规则(例如,“同时发生”或者“从一个对象可以推出另一个对象),关联规则挖掘的一般对象是事务(Tansactional)数据库. 这种数据库的一个主要应用是零售业,比如超级市场的管理。 例如,5%的顾客购买“挪亚牌”面包(用项目A表示),买“挪亚牌”面包的

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档