2026年大数据技术(数据挖掘算法基础)试题及答案
一、单项选择题(每题2分,共20分)
1.在决策树算法中,若某属性将数据集划分为三个子集,其对应的样本数量分别为10、20、30,且各子集的类别熵分别为0.8、0.6、0.4,则该属性的信息增益计算时,子节点的平均熵为()。
A.(10×0.8+20×0.6+30×0.4)/(10+20+30)
B.(0.8+0.6+0.4)/3
C.(10/(10+20+30))×0.8+(20/60)×0.6+(30/60)×0.4
D.max(0.8,0.6,0.4)
2.Kmeans聚
原创力文档

文档评论(0)