数据管理——-决策树建模.ppt

数据管理——-决策树建模.ppt

第四章 决策树建模 §4.1 决策树介绍 分类是数据挖掘的一个重要课题, 它的目的是: 构造一个分类函数或分类模型(也常称为分类器), 该模型能把数据库中的数据项映射到给定类别中的某一个。 数据分类的过程一般来说主要包含两个步骤 第一步, 建立一个描述已知数据集类别或概念的模型 第二步, 利用所获得的模型进行分类操作 §4.1 决策树介绍链接 分类是数据挖掘的一个重要课题, 它的目的是: 构造一个分类函数或分类模型(也常称为分类器), 该模型能把数据库中的数据项映射到给定类别中的某一个。 数据分类的过程一般来说主要包含两个步骤 第一步, 建立一个描述已知数据集类别或概念的模型 第二步, 利用所获得的模型进行分类操作 §4.1 决策树介绍-2 第一步, 建立一个描述已知数据集类别或概念的模型 该模型是通过对数据库中各数据进行内容的分析而获得的。 分类学习方法所使用的数据集称为训练样本集合,每一数据行都属于一个确定的数据类别,其类别值是由一个属性来描述的(被称为类别标记属性)。 因此分类学习又可称为监督学习,它是在已知训练样本类别情况下,通过学习建立相应模型。而无监督学习则是在训练样本的类别与类别个数均未知的情况下进行的,如聚类分析。 §4.1 决策树介绍-2 第二步, 利用所获得的模型进行分类操作 首先对模型分类准确率进行估计。 Hol

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档