第五章数据分类.pptVIP

  • 71
  • 0
  • 约7.14千字
  • 约 56页
  • 2017-06-21 发布于湖北
  • 举报
第五章数据分类概要

例:构造决策树。 下表给出了取自AllElectronics顾客数据库元组训练集。 编号 年龄 收入 学生 信用等级 类别:购买电脑 1 =30 高 否 一般 不会购买 2 =30 高 否 良好 不会购买 3 31…40 高 否 一般 会购买 4 40 中等 否 一般 会购买 5 40 低 是 一般 会购买 6 40 低 是 良好 不会购买 7 31…40 低 是 良好 会购买 8 =30 中等 否 一般 不会购买 9 =30 低 是 一般 会购买 10 40 中等 是 一般 会购买 11 =30 中等 是 良好 会购买 12 31…40 中等 否 良好 会购买 13 31…40 高 是 一般 会购买 14 40 中等 否 良好 不会购买 解:由题意可知: s=14,类标号属性“购买电脑”有两个不同值(即{会购买,不会购买}),因此有两个不同的类(即m=2)。设类C1对应于“会购买”,类C2对应于“不会购买”。则s1=9,s2=5,p1=9/14,p2=5/14。 ①计算对给定样本分类所需的期望信息: ②计算每个属性的熵。 先计算属性“年龄”的熵。 对于年龄=“=30”:s11=2,s21=3,p11=2/5,p21=3/5,

文档评论(0)

1亿VIP精品文档

相关文档