大数据分析与挖掘第六章 分类.pptxVIP

  • 3
  • 0
  • 约2.82千字
  • 约 82页
  • 2026-06-17 发布于湖南
  • 举报

第六章分类;本章内容;数值预测(numericprediction)

对连续型变量建立函数依赖,预测未知的或缺失的数据;

分类(classification)

对离散型变量建立函数依赖,预测未知的或缺失的数据;

;1.分类方法概况;1.分类方法概况;分类的一般方法

建立模型(学习阶段):构造分类器(classifier)

每个对象的类标号是已知的,由类标号属性(classlabelattribute)表示

用来建模的对象集合:训练元组(trainingset)

Y=f(X),模型用分类规则,决策树,或数学公式表示

应用模型(分类阶段):利用模型预测类标号

选择一组测试数据检测模型的准确度

测试数据集(testset)与训练数据集是不同的

用模型推导出来的类标号与已知的类标号比较,如果相同,则称结果是正确的

准确度(accuracy)等于测试数据集中由模型得到正确结果的对象比例;分类的过程(1):建立模型;分类过程(2):根据模型预测;常见分类算法;评价分类方法的因素;本章内容;2.决策树分类;2.决策树分类;2.决策树分类;2.决策树分类;2.决策树分类;基本算法(agreedyalgorithm)

按照从上到下递归的方法生成决策树

根结点对应全部训练数据

属性是分类型的(ifcontinuous-valued,theyarediscreti

文档评论(0)

1亿VIP精品文档

相关文档