数据挖掘第二次作业.docVIP

  • 10
  • 0
  • 约9.37千字
  • 约 16页
  • 2020-09-04 发布于天津
  • 举报
数据挖掘第二次作业第一题答案因为分为两类和其中的频数为个的频数为所以元组的信息增益为进行分类按照进行分类按照进行分类按照进行分类得到的信息增益最大所以决策树为中的信息增益结果可以看出采用由第二题隐藏层输出层输入层由可以设每个输入单元代表的属性和初始赋值由于初始的权重和偏倚值是随机生成的所以在此定义初始值为净输入和输出单元净输入输出每个节点的误差表单元权重和偏倚的更新第三题答定义其中表示没有毕业的学生表示毕业的学生表示抽烟则由题意而知则问题则是求由则由可以看出随机抽取一个抽烟的大学生是毕业生的概率

数据挖掘第二次作业 第一题: 1. a) Compute the Information Gain for Gender, Car Type and Shirt Size. b) Construct a decision tree with Information Gain. 答案: a) 因为class分为两类:C0和C1,其中C0的频数为10个,C1的频数为10,所以class Info(D)==1 元组的信息增益为 Gender进行分类:按照1. =0.971 Info(D)=Gain(Gender)=1-0.971=0.029 Car Type进

文档评论(0)

1亿VIP精品文档

相关文档