第4章节:决策树-2017-v2.pptVIP

  • 15
  • 0
  • 约1.05万字
  • 约 79页
  • 2018-11-09 发布于湖北
  • 举报
第4章节:决策树-2017-v2

基于 Classification Error的划分 给定结点t的 Classification Error值计算 : 当类分布均衡时, error值达到最大值 (1 - 1/nc) 相反当只有一个类时, error值达到最小值0 例子 P(C1) = 0/6 = 0 P(C2) = 6/6 = 1 Error = 1 – max (0, 1) = 1 – 1 = 0 P(C1) = 1/6 P(C2) = 5/6 Error = 1 – max (1/6, 5/6) = 1 – 5/6 = 1/6 P(C1) = 2/6 P(C2) = 4/6 Error = 1 – max (2/6, 4/6) = 1 – 4/6 = 1/3 不纯性度量之间的比较 二元分类问题: 4.1 预备知识 4.2 解决分类问题的一般方法 4.3 决策树归纳 4.3.1决策树的工作原理 4.3.2如何建立决策树 补充:ID3决策树详解(后继C4.5) 4.3.3表示属性测试条件的方法 4.3.4选择最佳划分的度量 4.4模型的过分拟合 模型过分拟合和拟合不足 分类模型的误差大致分为两种: 训练误差:是在训练记录上误分类样本比例 泛化误差:是模型在未知记录上的期望误差 一个好的分类模型不仅要能够很好的拟合训练数据,而且对未知样本也要能准确分类。 换句

文档评论(0)

1亿VIP精品文档

相关文档