- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
机器学习工程师考试试卷
一、单项选择题(共10题,每题1分,共10分)
以下哪项是监督学习的典型任务?
A.聚类分析
B.异常检测
C.图像分类
D.降维处理
答案:C
解析:监督学习需要标签数据,任务包括分类、回归等。图像分类(C)需要标注的图像标签作为训练数据,属于监督学习。聚类(A)、异常检测(B)、降维(D)均为无监督学习任务,无需标签数据。
在混淆矩阵中,“真正例(TP)”指的是?
A.实际正类被预测为负类
B.实际负类被预测为正类
C.实际正类被预测为正类
D.实际负类被预测为负类
答案:C
解析:混淆矩阵中,TP(TruePositive)定义为实际正类被正确预测为正类(C)。A是假负类(FN),B是假正类(FP),D是真负类(TN)。
以下哪种算法通过最大化间隔来分类数据?
A.逻辑回归
B.支持向量机(SVM)
C.决策树
D.K近邻(KNN)
答案:B
解析:SVM的核心是找到最大间隔超平面,将不同类别数据分开(B)。逻辑回归(A)通过概率模型分类,决策树(C)基于特征划分,KNN(D)基于邻近样本投票,均不直接最大化间隔。
过拟合的主要原因是?
A.模型复杂度不足
B.训练数据量过大
C.模型对训练数据过度学习
D.特征数量过少
答案:C
解析:过拟合是模型在训练集上表现很好,但泛化能力差,本质是模型过度学习了训练数据中的噪声和细节(C)。A是欠拟合的原因,B和D与过拟合无直接因果关系。
以下哪项不是神经网络中激活函数的作用?
A.引入非线性
B.控制输出范围
C.加速梯度计算
D.防止梯度消失
答案:C
解析:激活函数的主要作用是引入非线性(如ReLU)、控制输出范围(如Sigmoid输出[0,1])、缓解梯度消失(如ReLU)。梯度计算速度由优化器和网络结构决定,与激活函数无直接关联(C错误)。
在梯度下降中,“批量梯度下降(BGD)”的特点是?
A.每次仅用1个样本更新参数
B.每次用全部训练数据计算梯度
C.训练速度快但方差大
D.容易陷入局部最优
答案:B
解析:BGD每次使用全部训练数据计算梯度(B),优点是梯度方向准确,缺点是计算成本高。A是随机梯度下降(SGD),C是SGD的特点,D是所有梯度下降算法的潜在问题,但BGD更稳定。
以下哪种指标适用于不平衡数据集的分类评估?
A.准确率(Accuracy)
B.F1值
C.均方误差(MSE)
D.R平方(R2)
答案:B
解析:不平衡数据中,准确率(A)会因多数类主导而失真;F1值综合了精确率和召回率,更适合评估少数类的分类效果(B)。C和D是回归任务的指标。
决策树的剪枝操作主要是为了?
A.增加模型复杂度
B.解决过拟合问题
C.提高训练速度
D.增强可解释性
答案:B
解析:剪枝通过删除冗余分支,减少模型对训练数据的过度拟合(B)。A与剪枝目标相反,C是剪枝的间接效果(模型变简单),D是决策树本身的特性,与剪枝无直接关联。
以下哪项属于无监督学习?
A.预测房价(回归)
B.用户分群(聚类)
C.垃圾邮件分类
D.情感分析(正/负)
答案:B
解析:无监督学习无需标签,用户分群(B)通过数据内在结构聚类,属于无监督。A、C、D均需要标签数据,属于监督学习。
随机森林(RandomForest)的“随机”不体现在?
A.随机选择样本(自助采样)
B.随机选择特征子集
C.随机初始化树的参数
D.随机生成决策树的分裂点
答案:C
解析:随机森林的随机性体现在样本自助采样(A)、特征子集随机选择(B)、分裂点随机选择(D)。树的参数(如最大深度)通常由超参数设定,并非随机初始化(C错误)。
二、多项选择题(共10题,每题2分,共20分)
以下属于正则化方法的有?(至少2个正确选项)
A.L1正则化(Lasso)
B.早停(EarlyStopping)
C.Dropout
D.批量归一化(BatchNorm)
答案:ABC
解析:正则化用于防止过拟合。L1正则化(A)通过添加参数绝对值和惩罚项;早停(B)通过提前终止训练避免过拟合;Dropout(C)随机失活神经元,强制模型学习鲁棒特征。BatchNorm(D)用于稳定训练,不属于正则化。
深度学习中常用的优化器包括?
A.SGD(随机梯度下降)
B.Adam
C.K-means
D.RMSprop
答案:ABD
解析:优化器用于更新模型参数。SGD(A)、Adam(B)、RMSprop(D)均为常用优化器。K-means(C)是聚类算法,非优化器。
以下哪些指标可用于回归模型评估?
A.均方误差(MSE)
B.平均绝对误差(MAE)
C.精确率(Precision)
D.R平方(R2
您可能关注的文档
- 2025年注册合规师(CRCMP)考试题库(附答案和详细解析)(1220).docx
- 2025年注册建筑师考试题库(附答案和详细解析)(1227).docx
- 2025年注册验船师考试题库(附答案和详细解析)(1221).docx
- 2025年注册用户体验设计师(UXD)考试题库(附答案和详细解析)(1227).docx
- 2026年建筑节能评估师考试题库(附答案和详细解析)(0104).docx
- 2026年信息治理专家考试题库(附答案和详细解析)(0107).docx
- 2026年医疗护理员考试题库(附答案和详细解析)(0107).docx
- 2026年隐私保护工程师(CIPT)考试题库(附答案和详细解析)(0106).docx
- 2026年英国特许证券与投资协会会员(CISI)考试题库(附答案和详细解析)(0102).docx
- 2026年增强现实设计师考试题库(附答案和详细解析)(0104).docx
- DB44_T+2767-2025河口海湾总氮、总磷水质评价指南.docx
- 中医药科技成果转化评价技术规范.docx
- DB44_T+2750-2025农村供水工程数字化建设技术导则.docx
- DB44_T+2769-2025金属矿山生态修复技术规范.docx
- 镁合金航天航空零部件长效防护微弧氧化膜层工艺规范.docx
- 《甘青青兰中绿原酸和胡麻苷含量的测定 高效液相色谱法》发布稿.pdf
- DB44_T+753-2025声环境质量自动监测技术规范.docx
- 信息技术 智算服务 异构算力虚拟化及池化系统要求.docx
- DB44_T+2759-2025黄荆栽培技术规程.docx
- 废生物制药溶媒再生乙腈.docx
原创力文档


文档评论(0)