- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
机器学习工程师考试试卷
一、单项选择题(共10题,每题1分,共10分)
以下哪种算法属于监督学习?
A.K-means聚类
B.主成分分析(PCA)
C.支持向量机(SVM)
D.关联规则挖掘(Apriori)
答案:C
解析:监督学习需要标签数据进行训练,SVM通过样本的特征和标签学习分类边界,属于监督学习。A(K-means)和B(PCA)是无监督学习(无标签),D(Apriori)是关联分析(无标签),均错误。
当模型在训练集上表现很好但测试集上表现差时,最可能的原因是?
A.欠拟合
B.过拟合
C.数据泄露
D.特征不足
答案:B
解析:过拟合指模型过度学习训练集的噪声,导致泛化能力差,测试集表现差。欠拟合(A)是训练集和测试集表现都差;数据泄露(C)是测试数据参与训练;特征不足(D)属于欠拟合的原因之一,均错误。
以下哪个指标最适合评估不平衡数据集的分类性能?
A.准确率(Accuracy)
B.F1-score
C.均方误差(MSE)
D.R方(R2)
答案:B
解析:不平衡数据中,准确率(A)会被多数类主导,无法反映少数类性能;F1-score是精确率和召回率的调和平均,更适合不平衡场景。C(MSE)和D(R2)用于回归任务,错误。
决策树中,信息增益主要用于?
A.剪枝
B.选择分裂特征
C.计算叶节点类别
D.处理缺失值
答案:B
解析:信息增益衡量特征对数据划分的纯度提升,决策树通过比较各特征的信息增益选择最优分裂特征(B正确)。剪枝(A)是减少过拟合的方法;叶节点类别(C)由多数投票决定;缺失值处理(D)通常用替代值或权重调整,错误。
神经网络中,ReLU激活函数的主要优点是?
A.避免梯度消失
B.输出值在(0,1)
C.计算复杂度高
D.适合所有层
答案:A
解析:ReLU(f(x)=max(0,x))在x0时梯度为1,避免了Sigmoid的梯度消失问题(A正确)。输出范围(B)是Sigmoid的特点;计算复杂度(C)是缺点;不适合输出层(D错误,输出层常用Sigmoid或Softmax)。
以下哪种方法属于模型正则化?
A.增加训练数据量
B.特征标准化
C.L2正则化
D.早停法(EarlyStopping)
答案:C
解析:正则化通过在损失函数中添加惩罚项限制模型复杂度,L2正则化(权重平方和)是典型方法(C正确)。增加数据(A)是数据层面防过拟合;特征标准化(B)是预处理;早停法(D)是训练策略,均不属于正则化。
随机森林(RandomForest)的核心思想是?
A.基模型串行训练,纠正前序错误
B.基模型并行训练,通过投票集成
C.仅随机选择特征
D.仅随机选择样本
答案:B
解析:随机森林是Bagging的典型实现,通过Bootstrap采样(随机选样本)和随机选特征子集训练多棵决策树,最终投票集成(B正确)。A是Boosting(如XGBoost)的特点;C和D不完整,错误。
以下哪项不是梯度下降的优化方法?
A.Adam
B.SGD
C.牛顿法
D.交叉熵
答案:D
解析:交叉熵是损失函数(用于分类任务),不是优化方法(D错误)。Adam(A)和SGD(B)是梯度下降的变种;牛顿法(C)是二阶优化方法,均属于优化方法。
强化学习中,智能体(Agent)的核心目标是?
A.最小化即时奖励
B.最大化长期累积奖励
C.完全模仿人类行为
D.拟合训练数据分布
答案:B
解析:强化学习通过“试错”学习策略,目标是最大化未来累积奖励(B正确)。A与目标相反;C是模仿学习的目标;D是监督学习的目标,错误。
模型部署时,以下哪项是关键考虑因素?
A.训练集准确率
B.模型推理延迟
C.特征工程复杂度
D.超参数数量
答案:B
解析:部署需考虑模型在生产环境中的性能,推理延迟(响应时间)直接影响用户体验(B正确)。训练准确率(A)不反映泛化性;特征工程(C)是训练阶段任务;超参数(D)是调优阶段任务,错误。
二、多项选择题(共10题,每题2分,共20分)
以下属于无监督学习的算法有?
A.层次聚类(HierarchicalClustering)
B.逻辑回归(LogisticRegression)
C.自编码器(Autoencoder)
D.K近邻(KNN)
答案:AC
解析:无监督学习处理无标签数据。A(层次聚类)通过数据内在结构分组;C(自编码器)学习数据压缩表示,均为无监督。B(逻辑回归)和D(KNN)需标签训练,属于监督学习,错误。
防止过拟合的方法包括?
A.增加模型复杂度
B.Dropout层
C.数据增强(DataAugmentation)
D.减少训练轮次(Epochs)
答案:
您可能关注的文档
- 2025年保荐代表人资格考试考试题库(附答案和详细解析)(1122).docx
- 2025年加拿大注册会计师(CPACanada)考试题库(附答案和详细解析)(1118).docx
- 2025年卫生专业技术资格考试题库(附答案和详细解析)(1125).docx
- 2025年应急救援指挥师考试题库(附答案和详细解析)(1107).docx
- 2025年智能安防工程师考试题库(附答案和详细解析)(1121).docx
- 2025年注册压力容器工程师考试题库(附答案和详细解析)(1125).docx
- 2025年注册电气工程师考试题库(附答案和详细解析)(1125).docx
- 2025年注册翻译专业资格(CATTI)考试题库(附答案和详细解析)(1118).docx
- 2025年注册职业卫生评估师考试题库(附答案和详细解析)(1117).docx
- 2025年注册计量师考试题库(附答案和详细解析)(1120).docx
原创力文档


文档评论(0)