- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2025年《人工智能训练师》考试练习题及答案
一、单项选择题(每题2分,共20分)
1.在图像分类任务中,标注员需要为每张图片标注“猫”“狗”“鸟”三个类别中的一个,此类标注属于()。
A.多标签分类标注
B.多分类标注
C.语义分割标注
D.目标检测标注
答案:B
解析:多分类标注指每个样本属于且仅属于一个类别(如本题中“猫”“狗”“鸟”互斥),多标签分类标注允许样本属于多个类别(如一张图片同时标注“猫”和“宠物”),语义分割标注需标注像素级类别,目标检测标注需框定目标位置并分类,故选B。
2.以下哪种方法最适合解决模型训练中的过拟合问题?()
A.增加训练数据量
B.减少神经网络层数
C.降低学习率
D.提高批量大小(BatchSize)
答案:A
解析:过拟合通常因模型复杂度过高或训练数据不足导致。增加训练数据量可增强模型泛化能力;减少层数可能降低模型表达能力(欠拟合风险);降低学习率影响收敛速度而非过拟合;提高批量大小主要影响训练稳定性,故选A。
3.某NLP任务中,需预测用户评论的情感倾向(积极/消极),最佳损失函数选择是()。
A.均方误差(MSE)
B.交叉熵损失(Cross-EntropyLoss)
C.绝对平均误差(MAE)
D.铰链损失(HingeLoss)
答案:B
解析:情感倾向属于二分类任务,交叉熵损失适用于分类问题(衡量预测概率与真实标签的差异);MSE和MAE用于回归任务;铰链损失主要用于支持向量机(SVM)的分类,故选B。
4.在数据预处理中,处理缺失值的方法不包括()。
A.删除包含缺失值的样本
B.用特征均值填充缺失值
C.用K近邻算法(KNN)预测缺失值
D.对缺失值单独编码为“未知”类别
答案:无(本题为干扰项,实际选项均为合理方法。正确题目应为:“以下处理缺失值的方法中,可能引入偏差的是()”,答案:B,因均值填充可能忽略数据分布特征。)
(注:此处为示例调整,实际考试需避免题目错误。)
5.以下关于迁移学习的描述,错误的是()。
A.迁移学习可将预训练模型的知识迁移到目标任务
B.目标任务数据量较小时,迁移学习效果更显著
C.源任务与目标任务的领域差异越大,迁移效果越好
D.微调(Fine-Tuning)是迁移学习的常见实现方式
答案:C
解析:迁移学习的核心是利用源任务与目标任务的相似性(如领域、特征分布),差异过大会导致负迁移(模型性能下降),故选C。
二、填空题(每空2分,共20分)
1.混淆矩阵中,TP表示“真阳性”,FN表示__________,FP表示__________。
答案:假阴性(实际为正,预测为负);假阳性(实际为负,预测为正)
2.交叉熵损失函数的公式为:\(L=-\frac{1}{N}\sum_{i=1}^{N}[y_i\log(\hat{y}_i)+(1-y_i)\log(1-\hat{y}_i)]\),其中\(y_i\)是__________,\(\hat{y}_i\)是__________。
答案:真实标签(0或1);模型预测的概率值(0到1之间)
3.Transformer模型中的注意力机制主要包括__________(如自注意力)和__________(如编码器-解码器注意力)。
答案:自注意力(Self-Attention);交叉注意力(Cross-Attention)
4.数据增强在图像任务中常用方法包括__________、__________(至少列举两种)。
答案:随机翻转(水平/垂直);随机裁剪;颜色抖动(任选两种)
5.评估模型公平性时,需检查不同__________(如性别、年龄)下的性能差异,避免对特定群体的__________。
答案:敏感属性;歧视(或“偏见”)
三、简答题(每题8分,共40分)
1.简述数据清洗的主要步骤及各步骤的目的。
答案:
数据清洗的主要步骤包括:
(1)缺失值处理:通过删除、填充(均值/中位数/众数)或模型预测等方法,避免缺失值导致模型训练偏差;
(2)异常值检测与修正:使用统计方法(如Z-score、IQR)或模型(如孤立森林)识别异常值,修正或剔除,防止模型被极端值误导;
(3)重复值处理:删除重复样本,避免训练数据冗余导致的过拟合;
(4)格式标准化:统一数据格式(如日期格式、单位),确保模型能正确读取特征;
(5)噪声处理:通过平滑技术(如移动平均)或滤波方法减少数据中的
您可能关注的文档
- 2025年《公共营养师》考试练习题含参考答案.docx
- 2025年《公共营养师》考试练习题及答案.docx
- 2025年《公共营养师》考试练习题与参考答案.docx
- 2025年《公共营养师》考试模拟练习题及参考答案.docx
- 2025年《公共营养师》考试模拟试题(附参考答案).docx
- 2025年《公共营养师》考试模拟试题附参考答案.docx
- 2025年《公共营养师》考试模拟试题及参考答案.docx
- 2025年《公共营养师》考试模拟习题及答案.docx
- 2025年《公共营养师》理论知识练习题及答案.docx
- 2025年《公共营养师》理论知识练习题库(附答案).docx
- Unit7Happy Birthday!单元语法精炼与写作专练(含答案)人教版(2024)英语七年级上册.docx
- 福建省泉州第一中学2025-2026学年九年级上学期第一次月考语文试题.docx
- 第8课《〈世说新语〉二则》同步练习(含答案) 2025-2026学年统编版语文七年级上册.docx
- 高速事故应急练习题库及答案.docx
- 牛津译林版九年级上册Unit 1 Know yourself知识过关第1讲--词汇(含答案).docx
- 牛津译林版九年级上册Unit 1 Know yourself知识过关第2讲--短语句型(含答案).docx
- 教版(2024)七年级下册Unit1单词巩固(一) 七上第一部分单词复习课件.pptx
- 人教版(2024)七年级下册Unit1单词巩固(二) 七上第二部分单词复习课件.pptx
- 译林版(2024)八年级上册Unit 1 Friendship周末练习作业(含答案).docx
- 化工防腐安全练习题库及答案.docx
文档评论(0)