- 0
- 0
- 约9.48千字
- 约 12页
- 2026-02-02 发布于江苏
- 举报
机器学习工程师考试试卷
一、单项选择题(共10题,每题1分,共10分)
以下哪项属于监督学习任务?
A.客户分群(聚类)
B.图像风格迁移(生成模型)
C.垃圾邮件分类(二分类)
D.异常检测(无监督)
答案:C
解析:监督学习需要输入数据(特征)与对应的标签(目标变量)。选项C中垃圾邮件分类需要已知邮件是否为垃圾(标签),属于典型的监督学习任务。A为无监督聚类,B为生成模型(可能需部分监督),D为无监督异常检测,均不符合监督学习定义。
用于评估分类模型的F1分数是以下哪两个指标的调和平均?
A.准确率(Accuracy)与召回率(Recall)
B.精确率(Precision)与召回率(Recall)
C.精确率(Precision)与准确率(Accuracy)
D.召回率(Recall)与FPR(假正率)
答案:B
解析:F1分数定义为精确率(查准率)和召回率(查全率)的调和平均,公式为(F1=2),用于平衡两者在模型评估中的重要性。其他选项均不符合F1的数学定义。
决策树中,信息增益的计算基于以下哪个指标?
A.基尼系数(GiniImpurity)
B.信息熵(Entropy)
C.均方误差(MSE)
D.交叉熵损失(Cross-EntropyLoss)
答案:B
解析:信息增益是父节点信息熵与子节点加权平均信息熵的差值,用于衡量特征对数据划分的有效性。基尼系数用于CART树的不纯度计算,MSE用于回归树,交叉熵是分类任务的损失函数,均与信息增益无关。
以下哪种方法不能缓解神经网络的过拟合问题?
A.增加训练数据量
B.减少网络层数(降低模型复杂度)
C.增大学习率(LearningRate)
D.应用Dropout层
答案:C
解析:过拟合的本质是模型对训练数据过度学习,泛化能力差。增大学习率可能导致训练不稳定或无法收敛,但不会直接缓解过拟合;A(数据增强)、B(降低复杂度)、D(随机失活)均是经典的过拟合缓解方法。
逻辑回归(LogisticRegression)的决策边界是?
A.线性的(Linear)
B.二次曲线(Quadratic)
C.任意形状(由核函数决定)
D.阶梯函数(StepFunction)
答案:A
解析:逻辑回归通过线性组合特征((z=w^Tx+b))后应用sigmoid函数,其决策边界((z=0))是线性的超平面。核函数用于支持向量机(SVM)的非线性扩展,阶梯函数是感知机的激活函数,均与逻辑回归无关。
在K近邻(KNN)算法中,以下哪种距离度量更适用于高维稀疏数据?
A.欧氏距离(EuclideanDistance)
B.曼哈顿距离(ManhattanDistance)
C.余弦相似度(CosineSimilarity)
D.切比雪夫距离(ChebyshevDistance)
答案:C
解析:高维稀疏数据中,特征的绝对值大小可能无意义(如文本的词频向量),而余弦相似度衡量向量方向的相似性,不受长度影响,更适合此类场景。欧氏距离和曼哈顿距离对稀疏数据的噪声敏感,切比雪夫距离用于极端值比较,均不适用。
以下哪项是集成学习中“Boosting”方法的典型特征?
A.并行训练多个弱学习器(如随机森林)
B.串行训练弱学习器,聚焦前序模型的错误样本
C.直接通过投票或平均整合结果(如Bagging)
D.仅适用于分类任务,不适用于回归任务
答案:B
解析:Boosting通过串行训练弱学习器,每个新学习器重点修正前序模型预测错误的样本(如AdaBoost调整样本权重),最终通过加权投票整合。A和C是Bagging的特征,Boosting同时支持分类和回归(如XGBoost),D错误。
以下哪种损失函数最适合多分类任务?
A.均方误差(MSE)
B.交叉熵损失(Cross-EntropyLoss)
C.Hinge损失(HingeLoss)
D.指数损失(ExponentialLoss)
答案:B
解析:多分类任务中,交叉熵损失(结合softmax函数)直接优化类别概率分布的对数似然,是最常用的损失函数。MSE用于回归,Hinge损失是SVM的分类损失,指数损失是AdaBoost的损失函数,均非多分类最优选择。
特征工程中,“独热编码(One-HotEncoding)”主要用于处理以下哪种类型的特征?
A.连续数值特征(如温度)
B.有序类别特征(如学历:高中/本科/硕士)
C.无序类别特征(如颜色:红/蓝/绿)
D.文本特征(如用户评论)
答案:C
解析:独热编码将无序类别特征(无大小顺序)转换为二进制向量(每个类别对应一个维度),避免模型错误引入类别间的顺序关系。有序类别特
您可能关注的文档
- 2026年保荐代表人资格考试考试题库(附答案和详细解析)(0117).docx
- 2026年医药研发注册师考试题库(附答案和详细解析)(0118).docx
- 2026年咖啡师考试题库(附答案和详细解析)(0116).docx
- 2026年建筑节能评估师考试题库(附答案和详细解析)(0131).docx
- 2026年法律职业资格考试(法考)考试题库(附答案和详细解析)(0115).docx
- 2026年注册职业卫生评估师考试题库(附答案和详细解析)(0124).docx
- 2026年注册计量师考试题库(附答案和详细解析)(0117).docx
- 2026年游戏引擎开发师考试题库(附答案和详细解析)(0113).docx
- 2026年计算机视觉工程师考试题库(附答案和详细解析)(0102).docx
- REITs估值方法的国际比较与调整.docx
- 人教版八年级上册历史精品教学课件 第六单元 中华民族的抗日战争 第17课 七七事变与全民族抗战 (6).ppt
- 人教版八年级上册历史精品教学课件 期末专题复习 专题二 中国人民近代化的探索 (2).ppt
- 人教版八年级上册历史精品教学课件 第二单元 近代化的早期探索与民族危机的加剧 第5课 甲午中日战争与列强瓜分中国狂潮 (2).ppt
- 人教版八年级上册历史精品教学课件 第七单元 人民解放战争 大概念引领下的大单元复习 (4).ppt
- 人教版八年级上册历史精品教学课件 第七单元 人民解放战争 第21课 人民解放战争的胜利 (2).ppt
- 人教版八年级上册历史精品教学课件 第三单元 资产阶级民主革命与中华民国的建立 第10课 中华民国的创建 (2).ppt
- 人教版八年级上册历史精品教学课件 第四单元 新民主主义革命的开始 第12课 新文化运动 (3).ppt
- 第四组塑料低温脆化温度测试详解演示文稿.ppt
- 第消费者行为演示文稿.ppt
- 第一部分用搜索方法求解问题演示文稿.ppt
最近下载
- 大理石窗台板施工工程技术规范.docx VIP
- 2025年长沙卫生职业学院单招职业适应性测试题库及答案(夺冠系列).docx VIP
- 教科版四年级科学下册第三单元知识点.doc VIP
- 工程造价咨询服务方案 第二章 工作流程及进度控制方案.docx VIP
- 学堂在线 雨课堂 学堂云 如何写好科研论文 期末考试答案.docx VIP
- 2025年拍卖师稿本、抄本与批校本的价值鉴定专题试卷及解析.pdf VIP
- 2025-2026学年浙江省杭州市滨江区六年级上期末数学试卷(附答案解析).pdf VIP
- 通化县生活垃圾处理场场地环境调查与风险评估报告.PDF VIP
- 维生素D及其类似物的临床应用共识(2025版)解读.pptx
- FZ T01057.2-2007 纺织纤维鉴别试验方法 第2部分.pdf
原创力文档

文档评论(0)