2025年上海大数据专高六第六单元机器学习与Hadoop测试卷附答案.docxVIP

  • 1
  • 0
  • 约3.66千字
  • 约 11页
  • 2026-05-07 发布于四川
  • 举报

2025年上海大数据专高六第六单元机器学习与Hadoop测试卷附答案.docx

2025年上海大数据专高六第六单元机器学习与Hadoop测试卷附答案

一、单项选择题(每题2分,共30分)

1.以下哪项不属于监督学习任务?

A.预测房价(连续值)

B.识别图像中的猫(二分类)

C.客户分群(无标签)

D.垃圾邮件检测(多分类)

2.Hadoop生态中,负责资源管理和任务调度的组件是?

A.HDFS

B.YARN

C.MapReduce

D.HBase

3.决策树算法中,信息增益主要用于?

A.确定剪枝阈值

B.选择最优划分特征

C.计算叶节点类别

D.防止过拟合

4.关于K-means聚类的描述,错误的是?

A.需要预先指定簇数K

B.对噪声和离群点敏感

C.适用于非凸形状的簇

D.基于样本与质心的距离划分

5.HDFS中默认的块大小是?

A.32MB

B.64MB

C.128MB

D.256MB

6.机器学习中,均方误差(MSE)通常用于?

A.分类任务的损失函数

B.回归任务的损失函数

C.聚类任务的评估指标

D.降维任务的优化目标

7.MapReduce作业中,Shuffle阶段的核心操作是?

A.将Map输出按键分组并排序

B.执行具体的计算逻辑

C.管

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档