第5章数据分类.pptVIP

  • 2
  • 0
  • 约 44页
  • 2017-02-09 发布于重庆
  • 举报
第5章数据分类

* * * * * * * * * * Data Mining Tool - Decision Tree, Jiahuang Ji, Ph.D. All Rights Reserved * 1. 假定选择信誉作树根节点,则: 良好组: I(480,192)=0.8631 优秀组: I(161,191)=0.9948 2. 良好组比例: 672/1024=0.6563 优秀组比例: 352/1024=0.3437 3. 平均信息期望(加权总和): E(信誉)= 0.6563 * 0.8631 + 0.3437 * 0.9948 = 0.9048 4. Gain(信誉) = I(641, 383)-E(信誉) =0.9537 – 0.9048= 0.0453 计数 年龄 收入 学生 信誉 归类:买计算机? 64 青 高 否 优 不买 64 老 低 是 优 不买 64 中 低 是 优 买 64 青 中 是 优 买 32 中 中 否 优 买 63 老 中 否 优 不买 1 老 中 否 优 买 计数 年龄 收入 学生 信誉 归类:买计算机? 64 青 高 否 良 不买 128 中 高 否 良 买 60 老 中 否 良 买 64 老 低 是 良 买 128 青 中 否 良 不买 64 青 低 是 良 买 132 老 中 是 良 买

文档评论(0)

1亿VIP精品文档

相关文档