- 4
- 0
- 约3.82千字
- 约 19页
- 2019-11-06 发布于广东
- 举报
* 第十一讲 分类方法 本讲讲授目标: 1. 分类的基本概念 2. 决策树方法 3. 决策树方法的评价 * 一. 分类的基本概念 数据分类(data classfication)是数据挖掘的主要内容之一,主要是通过分析训练数据样本,产生关于类别的精确描述。这种类别通常由分类规则组成,可以用来对未来的数据进行分类和预测。 * 数据分类过程 第1步:建立一个模型,描述给定的数据类集或概念集(简称训练集)。 通过分析由属性描述的数据库元组来构造模型。用于建立模型的元组集称为训练数据集,其中每个元组称为训练样本。如果训练样本的类别是未知的,则称为无指导的学习(聚类)。学习模型可用分类规则、决策树和数学公式的形式给出。 第2步:使用模型对数据进行分类。包括评估模型的分类准确性以及对类标号未知的元组按模型进行分类。 * 数据分类过程 训练数据 分类算法 分类规则 (a) 学习 分类规则 新数据 测试数据 (b) 分类 * 常用的分类规则挖掘方法 分类规则的挖掘通常有以下几种方法 决策树方法 贝叶斯方法 人工神经网络方法 约略集方法 遗传算法 典型的分类规则挖掘算法有: ID3 C4.5 DBlearn等 * 分类方法的评估标准 准确率:模型正确预测新数据类标号的能力。 速度:产生和使用模型花费的时间。 健壮性:有噪声数据或空缺值数据时模型正确分类或预测
您可能关注的文档
最近下载
- 数学物理方程-谷超豪.pdf VIP
- 1例静脉采血致桡神经损伤病人的护理.pptx VIP
- 静脉采血损伤.pptx VIP
- JB∕T 14397-2022 食品机械 静水压杀菌设备.pdf
- 八年级生物下册7.3人类与自然界的协调发展单元检测含解析新版冀教版.doc VIP
- 马凡综合征麻醉管理要点.pptx VIP
- 合肥经济学院专升本法学专业真题.docx VIP
- 生态旅游课程体系构建与教学方法创新研究.docx VIP
- 冀少版生物八年级下册单元检测卷 第七单元第一章 生物与环境的关系(测能力).pdf VIP
- 2026春统编版语文 语文二年级下册语文园地二 课件 (56张PPT).pptx VIP
原创力文档

文档评论(0)