机器学习方法与实践 习题及答案 C4.5.docx

机器学习方法与实践 习题及答案 C4.5.docx

【主观题】简述C4.5与ID3算法的区别

答案:

(1)分支指标采用增益比例

(2)数值属性的处理

(3)处理缺少属性值的训练样本

(4)使用K次迭代交叉验证,评估模型的优劣程度;

(5)根据生成的决策树,可以产生一个if-then规则的集合。

难易程度:易

作答时间(秒):300

分类:掌握

归属人:

【主观题】简述AUC的计算方法

答案:对

难易程度:中

作答时间(秒):60

答案解析:从AUC统计意义去计算。所有的正负样本对中,正样本排在负样本前面占样本对数的比例,即这个概率值。

具体的做法就是它也是首先对probscore从大到小排序,然后令最大probscore对应的sample

文档评论(0)

1亿VIP精品文档

相关文档