2026年大数据技术(数据挖掘算法基础)试题及答案.docx

2026年大数据技术(数据挖掘算法基础)试题及答案.docx

2026年大数据技术(数据挖掘算法基础)试题及答案

一、单项选择题(每题2分,共20分)

1.在决策树算法中,若某属性将数据集划分为三个子集,其对应的样本数量分别为10、20、30,且各子集的类别熵分别为0.8、0.6、0.4,则该属性的信息增益计算时,子节点的平均熵为()。

A.(10×0.8+20×0.6+30×0.4)/(10+20+30)

B.(0.8+0.6+0.4)/3

C.(10/(10+20+30))×0.8+(20/60)×0.6+(30/60)×0.4

D.max(0.8,0.6,0.4)

2.Kmeans聚

文档评论(0)

1亿VIP精品文档

相关文档