- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
机器学习工程师考试试卷
一、单项选择题(共10题,每题1分,共10分)
以下哪项属于监督学习任务?
A.客户分群(聚类)
B.垃圾邮件分类
C.图像降维(PCA)
D.异常检测(基于统计)
答案:B
解析:监督学习需要输入数据(特征)和对应的标签(目标变量)。垃圾邮件分类中,每封邮件(特征)有明确的“垃圾”或“非垃圾”标签(监督信号);A(聚类)、C(降维)、D(异常检测,通常无标签)均属于无监督学习任务。
以下哪种算法通过最大化间隔来分类数据?
A.逻辑回归
B.决策树
C.支持向量机(SVM)
D.K近邻(KNN)
答案:C
解析:SVM的核心目标是找到数据点之间的最大间隔超平面,使不同类别样本到超平面的距离最大化;逻辑回归通过概率建模分类(对数几率函数),决策树通过特征分割构建规则,KNN通过近邻投票分类,均不直接优化间隔。
当模型在训练集上表现很好但测试集上表现差时,最可能的原因是?
A.欠拟合
B.过拟合
C.数据噪声
D.特征不足
答案:B
解析:过拟合指模型过度学习训练数据的细节(包括噪声),导致泛化能力差(测试集表现差);欠拟合是模型无法捕捉数据规律(训练集表现也差);数据噪声和特征不足可能加剧过拟合,但直接原因是过拟合。
以下哪项是评估回归模型的常用指标?
A.准确率(Accuracy)
B.F1分数
C.均方误差(MSE)
D.ROC-AUC
答案:C
解析:回归任务的目标是预测连续值,均方误差(MSE)衡量预测值与真实值的平方差均值,是回归的典型指标;A(分类)、B(分类)、D(分类,衡量二分类模型区分能力)均用于分类任务。
特征工程中,“将年龄字段从连续值转换为‘青年/中年/老年’分箱”属于?
A.特征选择
B.特征提取
C.特征编码
D.特征缩放
答案:B
解析:特征提取是通过现有特征生成新特征(如分箱、多项式变换);特征选择是筛选重要特征(如删除冗余特征);特征编码是将类别变量转为数值(如独热编码);特征缩放是标准化或归一化(如Z-score)。
以下哪种神经网络层常用于图像识别?
A.全连接层
B.卷积层
C.循环层(RNN)
D.注意力层(Attention)
答案:B
解析:卷积层通过局部感受野和权值共享提取图像的空间特征(如边缘、纹理),是CNN的核心;全连接层用于整合全局信息,RNN用于序列数据(如文本),注意力层用于捕捉长距离依赖(如机器翻译)。
超参数调优时,以下哪种方法效率最高(相同计算资源下)?
A.网格搜索
B.随机搜索
C.贝叶斯优化
D.手动调参
答案:C
解析:贝叶斯优化通过概率模型(如高斯过程)学习超参数与模型性能的关系,优先探索高潜力区域,比网格搜索(穷举)和随机搜索(随机采样)更高效;手动调参依赖经验,效率最低。
集成学习中,随机森林(RandomForest)主要通过哪种方式降低模型方差?
A.基模型间强依赖(Boosting)
B.样本和特征的随机采样(Bagging)
C.梯度残差拟合(GradientBoosting)
D.模型加权投票(Stacking)
答案:B
解析:随机森林是Bagging的典型实现,通过对训练数据(自助采样)和特征(随机子集)的双重随机化,生成多个独立基决策树,最终通过投票降低单棵树的高方差;A是Boosting(如GBDT)的特点,C是梯度提升的核心,D是Stacking的集成方式。
逻辑回归(LogisticRegression)的损失函数通常是?
A.均方误差(MSE)
B.交叉熵损失(Cross-Entropy)
hinge损失
D.指数损失
答案:B
解析:逻辑回归假设样本服从伯努利分布,通过极大似然估计推导,损失函数为交叉熵(衡量预测概率与真实标签的差异);MSE用于回归,hinge损失是SVM的损失函数,指数损失是AdaBoost的损失函数。
模型部署时,以下哪项不是需要考虑的关键因素?
A.推理延迟(Latency)
B.模型准确率
C.硬件成本
D.数据隐私
答案:B
解析:模型部署需考虑工程可行性(如延迟、硬件成本)、合规性(数据隐私),但模型准确率是训练阶段的核心指标(部署时默认已满足要求);若准确率不达标,模型不会进入部署阶段。
二、多项选择题(共10题,每题2分,共20分)
以下属于监督学习的典型任务有?(至少2个正确选项)
A.情感分析(文本分类)
B.房价预测(回归)
C.用户画像(聚类)
D.图像分割(像素级分类)
答案:ABD
解析:监督学习需要标签,A(情感标签:正面/负面)、B(房价真实值)、D(像素级类别标签)均有明确监督信号;C(聚类无标签)属于无监督学习。
以下哪些方法可以缓解过拟合?(至少2个正确
您可能关注的文档
- 2025年BIM工程师资格认证考试题库(附答案和详细解析)(1122).docx
- 2025年中医养生保健师考试题库(附答案和详细解析)(1126).docx
- 2025年医药研发注册师考试题库(附答案和详细解析)(1120).docx
- 2025年品牌管理师考试题库(附答案和详细解析)(1120).docx
- 2025年国际注册营养师考试题库(附答案和详细解析)(1123).docx
- 2025年数字化转型师考试题库(附答案和详细解析)(1121).docx
- 2025年算法工程师职业认证考试题库(附答案和详细解析)(1124).docx
- 2025年虚拟现实开发工程师考试题库(附答案和详细解析)(1124).docx
- 2025年计算机技术与软件专业技术资格(软考)考试题库(附答案和详细解析)(1119).docx
- AI技术支持协议.docx
- 初中英语人教版七年级上册第四单元Where is my schoolbag ! Section A .ppt
- 初中英语人教版七年级上册第四单元Where is my schoolbag Section B 2.ppt
- 初中英语人教版七年级下册 Unit 6 I'm watching TV. Section A 11a.pptx
- 注册土木工程师培训课件.ppt
- 初中生物济南版七年级上册第一章奇妙的生命现象 第三节生物学的探究方法.ppt
- 初中英语人教版七年级上册第四单元Where is my schoolbag Section B 2.pptx
- 注册安全工程师案例课件.ppt
- 初中物理人教版八年级上册第二章第4节噪声的危害和控制课件(共19张PPT).pptx
- 注册安全工程师王阳课件.ppt
- 初中数学青岛版八年级上2.4《线段的垂直平分线》课件(16张PPT).ppt
最近下载
- 穴位贴敷对风湿寒性膝关节痛的临床疗效分析.doc VIP
- 高空作业安全技术交底.doc VIP
- 电影功夫熊猫1-中英文台词.pdf VIP
- 奥的斯电梯300VF调试资料.pdf VIP
- 《甲状腺结节及相关疾病热消融中西医结合诊疗指南》(2025版).docx VIP
- 地产项目阿那亚归心之旅车主品鉴活动.pdf VIP
- 2025-2030中国聚合丁苯橡胶(SSBR)行业市场发展趋势与前景展望战略研究报告.docx
- 光伏功率预测系统产品手册(国能日新).pdf VIP
- STEM教育理念在高中政治课程中的应用与评估教学研究课题报告.docx
- 2015年阿那亚“始于度假终于社区”运营模式19p_图文..ppt VIP
原创力文档


文档评论(0)