2025年人工智能训练师(初级)职业资格认定参考试题库含答案.docxVIP

2025年人工智能训练师(初级)职业资格认定参考试题库含答案.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年人工智能训练师(初级)职业资格认定参考试题库含答案

一、单项选择题(共20题,每题2分,共40分)

1.以下哪项属于监督学习的典型任务?

A.聚类分析

B.异常检测

C.图像分类

D.关联规则挖掘

答案:C

解析:监督学习需要标签数据,图像分类(如识别猫/狗)是典型监督任务;聚类、异常检测、关联规则属于无监督或半监督学习。

2.在数据标注中,“为每张医疗影像标记肿瘤位置及类型”属于哪种标注类型?

A.分类标注

B.边界框标注

C.语义分割标注

D.关键点标注

答案:B

解析:边界框标注(BoundingBox)用于标记目标的位置和范围,语义分割需逐像素标注,关键点标注标记特定点(如人脸特征点)。

3.训练集、验证集、测试集的典型划分比例是?

A.6:2:2

B.7:1:2

C.5:3:2

D.8:1:1

答案:A

解析:常见划分比例为训练集60%、验证集20%、测试集20%,确保训练数据充足且验证测试独立。

4.以下哪种方法不能缓解过拟合?

A.增加训练数据量

B.减少模型复杂度

C.提高学习率

D.添加L2正则化

答案:C

解析:过拟合是模型对训练数据过度学习,提高学习率可能导致训练不稳定,无法缓解过拟合;增加数据、简化模型、正则化均有效。

5.评估分类模型时,“召回率(Recall)”的计算公式是?

A.正确预测的正类数/所有预测为正类的样本数

B.正确预测的正类数/所有实际为正类的样本数

C.正确预测的样本数/总样本数

D.正确预测的负类数/所有实际为负类的样本数

答案:B

解析:召回率(查全率)衡量模型找出所有正类样本的能力,公式为TP/(TP+FN)(TP:真阳性,FN:假阴性)。

6.在Python中,使用Pandas处理缺失值时,`df.fillna(method=ffill)`的作用是?

A.用列均值填充缺失值

B.用后向填充(后一个非缺失值填充)

C.用前向填充(前一个非缺失值填充)

D.删除所有含缺失值的行

答案:C

解析:`ffill`(forwardfill)是前向填充,用前一行同列的值填充当前缺失值;`bfill`为后向填充。

7.以下哪种神经网络结构适合处理序列数据(如文本、时间序列)?

A.卷积神经网络(CNN)

B.循环神经网络(RNN)

C.自编码器(Autoencoder)

D.生成对抗网络(GAN)

答案:B

解析:RNN通过循环单元捕捉序列中的时间依赖关系,适合处理序列数据;CNN擅长图像,GAN用于生成,自编码器用于特征提取。

8.数据标注时,“同一标注员对同一数据多次标注结果一致”反映的是标注质量的哪个指标?

A.准确性

B.一致性

C.完整性

D.时效性

答案:B

解析:一致性(信度)指同一标注员或不同标注员对同一数据的标注结果一致程度;准确性(效度)指标注与真实标签的匹配度。

9.训练模型时,若验证集准确率远低于训练集,最可能的原因是?

A.模型欠拟合

B.模型过拟合

C.学习率过低

D.数据量过大

答案:B

解析:过拟合表现为训练集准确率高(模型记住了噪声),验证集准确率低(泛化能力差);欠拟合则两者都低。

10.以下哪项不属于数据清洗的常见操作?

A.处理重复值

B.标准化数据范围(如归一化)

C.纠正错误标签

D.生成新特征(如时间差)

答案:D

解析:数据清洗包括去重、处理缺失值/异常值、纠正错误标签;生成新特征属于特征工程,是数据预处理的后续步骤。

11.在决策树中,“信息增益”用于选择最佳分裂特征,其计算基于?

A.基尼系数

B.熵(Entropy)

C.均方误差

D.余弦相似度

答案:B

解析:信息增益=父节点熵子节点加权熵,熵衡量数据混乱程度,用于分类问题;基尼系数是另一种分裂指标(CART算法)。

12.以下哪种数据增强方法不适合用于文本数据?

A.同义词替换

B.随机删除句子中的词

C.旋转图像角度

D.回译(将文本翻译成其他语言再译回)

答案:C

解析:旋转图像是图像数据增强方法,文本数据增强需保持语义,如同义词替换、回译等。

13.评估回归模型时,“均方误差(MSE)”的计算公式是?

A.Σ|预测值真实值|/n

B.Σ(预测值真实值)2/n

C.1

文档评论(0)

190****3828 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档