- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
人工智能(AI)训练师技能大赛理论考试题库50题(含答案)
1.数据标注中,“关键点标注”主要应用于以下哪种任务场景?
答案:目标检测(如人体姿态估计)或医学影像关键点定位任务。关键点标注通过标记图像中特定点(如关节、器官边界)的坐标,为模型提供空间位置监督信号。
2.数据清洗过程中,处理缺失值的常用方法不包括?
A.直接删除缺失值样本
B.用特征均值/中位数填充
C.构建预测模型填充缺失值
D.对缺失值列进行归一化
答案:D。归一化是数据标准化操作,不直接处理缺失值;前三者为典型缺失值处理方法。
3.以下哪种数据增强技术适用于自然语言处理(NLP)任务?
A.随机旋转
B.同义词替换
C.高斯模糊
D.颜色抖动
答案:B。同义词替换通过替换句子中的非关键词汇生成新样本,是NLP常用增强方法;其余为图像领域增强技术。
4.监督学习与无监督学习的核心区别在于?
答案:是否有标签数据。监督学习使用带标签数据训练模型(如分类、回归),无监督学习仅用无标签数据挖掘模式(如聚类、降维)。
5.训练图像分类模型时,若输入图像尺寸为224×224×3,经过3×3卷积核(步长1,padding=1)处理后,输出特征图尺寸为?
答案:224×224×C(C为卷积核数量)。计算公式:(H+2P-K)/S+1=(224+2×1-3)/1+1=224,因此尺寸不变。
6.以下哪项是循环神经网络(RNN)的主要缺陷?
A.无法处理序列数据
B.长距离依赖问题
C.参数量过大
D.仅支持二分类任务
答案:B。RNN通过隐藏状态传递信息,但梯度消失/爆炸问题导致难以捕捉长距离依赖关系,LSTM/GRU通过门控机制缓解此问题。
7.Transformer模型中,“多头注意力(Multi-HeadAttention)”的主要作用是?
答案:通过多个独立的注意力头并行学习不同子空间的上下文依赖,提升模型对不同位置关系的捕捉能力。每个头关注不同的语义或句法模式,最终拼接后输出更丰富的特征表示。
8.训练过程中,若验证集准确率持续上升但测试集准确率下降,可能的原因是?
A.学习率过低
B.模型过拟合
C.数据泄露
D.批量大小(BatchSize)过大
答案:C。验证集与测试集数据存在重叠(数据泄露)时,模型在验证集上表现虚高,但无法泛化到真实测试数据;过拟合会导致验证集准确率先升后降。
9.交叉熵损失函数(Cross-EntropyLoss)适用于以下哪种任务?
A.回归预测
B.二分类
C.多分类
D.B和C
答案:D。交叉熵损失通过计算预测概率与真实标签的对数似然,适用于二分类(sigmoid+交叉熵)和多分类(softmax+交叉熵)任务;回归任务常用均方误差(MSE)。
10.解决模型过拟合的方法不包括?
A.增加训练数据量
B.添加L2正则化
C.降低模型复杂度
D.增大学习率
答案:D。增大学习率可能导致训练不稳定或无法收敛,而非解决过拟合;其余选项通过数据增强、参数约束、简化模型结构缓解过拟合。
11.梯度下降优化算法中,Adam优化器结合了以下哪两种技术?
答案:动量(Momentum)和自适应学习率(RMSProp)。Adam通过动量项加速收敛,通过梯度平方的指数移动平均调整每个参数的学习率,适应不同参数的更新需求。
12.以下哪项是F1值的计算公式?
A.(2×精确率×召回率)/(精确率+召回率)
B.精确率+召回率
C.(精确率×召回率)/(精确率+召回率)
D.真阳性/(真阳性+假阳性)
答案:A。F1值是精确率(Precision)和召回率(Recall)的调和平均,综合衡量模型在正负样本上的表现。
13.在二分类任务中,若真实标签为[1,0,1,0],模型预测概率为[0.8,0.3,0.6,0.7](阈值设为0.5),则混淆矩阵中的真阳性(TP)数量是?
答案:2。预测结果为[1,0,1,1],真实阳性为前两个样本中的[1,1],正确预测的阳性是前两个中的第一个和第三个,即TP=2(样本1和3预测正确)。
14.模型可解释性技术中,LIME(局部可解释模型无关解释)的核心思想是?
答案:通过在预测样本附近生成扰动数据,训练一个局部可解释的简单模型(如线性回归),近似原模型的决策边界,从而解释单个预测的原因。
15.以下哪种数据预处理操作会改变特征的分布形状?
A.归一化(Min-MaxScaling)
B.标准化(Z-Score)
C.离散化(分箱)
文档评论(0)