- 10
- 0
- 约9.37千字
- 约 16页
- 2020-09-04 发布于天津
- 举报
数据挖掘第二次作业第一题答案因为分为两类和其中的频数为个的频数为所以元组的信息增益为进行分类按照进行分类按照进行分类按照进行分类得到的信息增益最大所以决策树为中的信息增益结果可以看出采用由第二题隐藏层输出层输入层由可以设每个输入单元代表的属性和初始赋值由于初始的权重和偏倚值是随机生成的所以在此定义初始值为净输入和输出单元净输入输出每个节点的误差表单元权重和偏倚的更新第三题答定义其中表示没有毕业的学生表示毕业的学生表示抽烟则由题意而知则问题则是求由则由可以看出随机抽取一个抽烟的大学生是毕业生的概率
数据挖掘第二次作业
第一题:
1.
a) Compute the Information Gain for Gender, Car Type and Shirt Size.
b) Construct a decision tree with Information Gain.
答案:
a) 因为class分为两类:C0和C1,其中C0的频数为10个,C1的频数为10,所以class Info(D)==1
元组的信息增益为 Gender进行分类:按照1. =0.971
Info(D)=Gain(Gender)=1-0.971=0.029
Car Type进
您可能关注的文档
最近下载
- 《新能源发电场站功率预测系统数据接入与性能考核标准》.pdf
- 钢结构吊装事故应急演练脚本.docx VIP
- 2026广西能汇投资集团有限公司校园招聘笔试备考题库及答案解析.docx VIP
- 机器人行业系列深度报告:外骨骼,肢体运动助手,应用场景拓展,全球产业加速.pdf VIP
- 国开形成性考核03998《★汽车故障诊断技术》章节作业(1-9)试题及答案.docx VIP
- 钢筋混凝土结构三维规范图集.pptx
- 竹简知识课件.pptx VIP
- 【演练脚本】吊装事故及触电事故应急演练脚本.docx VIP
- 2026中国大健康按摩足疗产业生存与发展白皮书.pdf VIP
- IPC-TM-650中文版-测试方法手册2025版.docx VIP
原创力文档

文档评论(0)