第十一讲 分类方法 .pptVIP

  • 4
  • 0
  • 约3.82千字
  • 约 19页
  • 2019-11-06 发布于广东
  • 举报
* 第十一讲 分类方法 本讲讲授目标: 1. 分类的基本概念 2. 决策树方法 3. 决策树方法的评价 * 一. 分类的基本概念 数据分类(data classfication)是数据挖掘的主要内容之一,主要是通过分析训练数据样本,产生关于类别的精确描述。这种类别通常由分类规则组成,可以用来对未来的数据进行分类和预测。 * 数据分类过程 第1步:建立一个模型,描述给定的数据类集或概念集(简称训练集)。 通过分析由属性描述的数据库元组来构造模型。用于建立模型的元组集称为训练数据集,其中每个元组称为训练样本。如果训练样本的类别是未知的,则称为无指导的学习(聚类)。学习模型可用分类规则、决策树和数学公式的形式给出。 第2步:使用模型对数据进行分类。包括评估模型的分类准确性以及对类标号未知的元组按模型进行分类。 * 数据分类过程 训练数据 分类算法 分类规则 (a) 学习 分类规则 新数据 测试数据 (b) 分类 * 常用的分类规则挖掘方法 分类规则的挖掘通常有以下几种方法 决策树方法 贝叶斯方法 人工神经网络方法 约略集方法 遗传算法 典型的分类规则挖掘算法有: ID3 C4.5 DBlearn等 * 分类方法的评估标准 准确率:模型正确预测新数据类标号的能力。 速度:产生和使用模型花费的时间。 健壮性:有噪声数据或空缺值数据时模型正确分类或预测

文档评论(0)

1亿VIP精品文档

相关文档