- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
机器学习工程师考试试卷
一、单项选择题(共10题,每题1分,共10分)
以下哪项属于监督学习任务?
A.聚类分析
B.图像分类
C.主成分分析(PCA)
D.异常检测
答案:B
解析:监督学习需要标签数据,图像分类(如识别猫/狗)需要标注的训练数据。A(聚类)和C(PCA)是无监督学习,D(异常检测)通常使用无监督或半监督方法。
逻辑回归中常用的损失函数是?
A.均方误差(MSE)
B.交叉熵损失
hinge损失
D.指数损失
答案:B
解析:逻辑回归用于二分类,目标是最小化预测概率与真实标签的交叉熵损失。A是回归任务的损失函数,C是SVM的损失函数,D是AdaBoost的损失函数。
以下哪种方法最可能用于解决过拟合问题?
A.增加训练数据量
B.减少正则化参数λ
C.增加模型层数
D.提高学习率
答案:A
解析:过拟合是模型对训练数据过度拟合,增加数据量可提升泛化能力。B(减少λ会削弱正则化,加剧过拟合)、C(增加层数会提高模型复杂度,加剧过拟合)、D(高学习率可能导致不收敛,与过拟合无关)均错误。
梯度下降算法中,“批量”指的是?
A.使用全部训练数据计算梯度
B.使用单个样本计算梯度
C.使用部分样本计算梯度
D.使用验证集计算梯度
答案:A
解析:批量梯度下降(BGD)每次迭代使用全部训练数据计算梯度,保证收敛但计算成本高。B是随机梯度下降(SGD),C是小批量梯度下降(MBGD)。
决策树中,信息增益基于以下哪个指标计算?
A.基尼系数
B.熵
C.均方误差
D.准确率
答案:B
解析:信息增益=父节点熵-子节点加权熵,用于衡量特征划分的纯度提升。A是CART树的分裂指标,C是回归树的损失函数,D是评估指标。
SVM中引入核函数的主要目的是?
A.降低计算复杂度
B.将低维线性不可分数据映射到高维线性可分空间
C.减少过拟合
D.提升模型可解释性
答案:B
解析:核函数(如RBF核)通过隐式映射将低维非线性问题转化为高维线性问题,避免显式计算高维特征。A(核函数可能增加计算复杂度)、C(正则化用于减少过拟合)、D(核函数降低可解释性)错误。
10折交叉验证的主要作用是?
A.加速模型训练
B.评估模型泛化能力
C.选择最优学习率
D.减少标签噪声
答案:B
解析:交叉验证通过多次划分训练/验证集,平均模型性能,更可靠地估计泛化能力。A(加速训练需优化算法)、C(超参数选择需结合网格搜索)、D(标签噪声需数据清洗)错误。
神经网络中,ReLU激活函数的主要优点是?
A.避免梯度消失
B.输出值范围在(0,1)
C.计算复杂度高
D.适用于所有层
答案:A
解析:ReLU(f(x)=max(0,x))在x0时梯度为1,缓解了Sigmoid/tanh的梯度消失问题。B(Sigmoid输出在(0,1))、C(ReLU计算简单)、D(输出层一般不用ReLU)错误。
以下属于集成学习中Bagging方法的是?
A.随机森林
B.GBDT
C.XGBoost
D.AdaBoost
答案:A
解析:Bagging(自助采样)通过并行训练多个基模型(如随机森林的决策树)并投票。B/C/D是Boosting方法(串行训练,关注错误样本)。
对特征进行标准化(Z-score)的主要原因是?
A.提高特征可解释性
B.避免模型对尺度敏感(如梯度下降收敛更快)
C.减少特征数量
D.增加特征非线性
答案:B
解析:标准化(μ=0,σ=1)使不同量纲的特征尺度一致,避免模型偏向大尺度特征(如梯度下降时各特征梯度量级相近)。A(可解释性与标准化无关)、C(特征选择减少数量)、D(特征构造增加非线性)错误。
二、多项选择题(共10题,每题2分,共20分)
以下属于正则化方法的有?
A.L1正则化(Lasso)
B.L2正则化(Ridge)
C.Dropout
D.数据增强
答案:ABCD
解析:正则化通过约束模型复杂度或增加数据多样性缓解过拟合。A/B通过添加参数范数惩罚项,C(随机失活神经元)降低模型依赖,D(如图像旋转、翻转)增加训练数据多样性。
深度学习模型的基本组件包括?
A.激活函数
B.损失函数
C.优化器
D.特征工程
答案:ABC
解析:深度学习通过网络结构自动提取特征,无需人工特征工程(D错误)。激活函数(如ReLU)引入非线性,损失函数(如交叉熵)定义优化目标,优化器(如Adam)更新参数。
特征工程的主要步骤包括?
A.特征选择(如方差阈值)
B.特征提取(如PCA降维)
C.特征构造(如组合特征)
D.模型调参(如调整学习率)
答案:ABC
解析:特征工程是数据预处理阶段,包括选择、提取、构造特征。D(模型调参)属于模型
文档评论(0)