- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2025年人工智能训练师(初级)职业资格认定参考试题库含答案
一、单项选择题(共20题,每题2分,共40分)
1.以下哪项属于监督学习的典型任务?
A.聚类分析
B.异常检测
C.图像分类
D.关联规则挖掘
答案:C
解析:监督学习需要标签数据,图像分类(如识别猫/狗)是典型监督任务;聚类、异常检测、关联规则属于无监督或半监督学习。
2.在数据标注中,“为每张医疗影像标记肿瘤位置及类型”属于哪种标注类型?
A.分类标注
B.边界框标注
C.语义分割标注
D.关键点标注
答案:B
解析:边界框标注(BoundingBox)用于标记目标的位置和范围,语义分割需逐像素标注,关键点标注标记特定点(如人脸特征点)。
3.训练集、验证集、测试集的典型划分比例是?
A.6:2:2
B.7:1:2
C.5:3:2
D.8:1:1
答案:A
解析:常见划分比例为训练集60%、验证集20%、测试集20%,确保训练数据充足且验证测试独立。
4.以下哪种方法不能缓解过拟合?
A.增加训练数据量
B.减少模型复杂度
C.提高学习率
D.添加L2正则化
答案:C
解析:过拟合是模型对训练数据过度学习,提高学习率可能导致训练不稳定,无法缓解过拟合;增加数据、简化模型、正则化均有效。
5.评估分类模型时,“召回率(Recall)”的计算公式是?
A.正确预测的正类数/所有预测为正类的样本数
B.正确预测的正类数/所有实际为正类的样本数
C.正确预测的样本数/总样本数
D.正确预测的负类数/所有实际为负类的样本数
答案:B
解析:召回率(查全率)衡量模型找出所有正类样本的能力,公式为TP/(TP+FN)(TP:真阳性,FN:假阴性)。
6.在Python中,使用Pandas处理缺失值时,`df.fillna(method=ffill)`的作用是?
A.用列均值填充缺失值
B.用后向填充(后一个非缺失值填充)
C.用前向填充(前一个非缺失值填充)
D.删除所有含缺失值的行
答案:C
解析:`ffill`(forwardfill)是前向填充,用前一行同列的值填充当前缺失值;`bfill`为后向填充。
7.以下哪种神经网络结构适合处理序列数据(如文本、时间序列)?
A.卷积神经网络(CNN)
B.循环神经网络(RNN)
C.自编码器(Autoencoder)
D.生成对抗网络(GAN)
答案:B
解析:RNN通过循环单元捕捉序列中的时间依赖关系,适合处理序列数据;CNN擅长图像,GAN用于生成,自编码器用于特征提取。
8.数据标注时,“同一标注员对同一数据多次标注结果一致”反映的是标注质量的哪个指标?
A.准确性
B.一致性
C.完整性
D.时效性
答案:B
解析:一致性(信度)指同一标注员或不同标注员对同一数据的标注结果一致程度;准确性(效度)指标注与真实标签的匹配度。
9.训练模型时,若验证集准确率远低于训练集,最可能的原因是?
A.模型欠拟合
B.模型过拟合
C.学习率过低
D.数据量过大
答案:B
解析:过拟合表现为训练集准确率高(模型记住了噪声),验证集准确率低(泛化能力差);欠拟合则两者都低。
10.以下哪项不属于数据清洗的常见操作?
A.处理重复值
B.标准化数据范围(如归一化)
C.纠正错误标签
D.生成新特征(如时间差)
答案:D
解析:数据清洗包括去重、处理缺失值/异常值、纠正错误标签;生成新特征属于特征工程,是数据预处理的后续步骤。
11.在决策树中,“信息增益”用于选择最佳分裂特征,其计算基于?
A.基尼系数
B.熵(Entropy)
C.均方误差
D.余弦相似度
答案:B
解析:信息增益=父节点熵子节点加权熵,熵衡量数据混乱程度,用于分类问题;基尼系数是另一种分裂指标(CART算法)。
12.以下哪种数据增强方法不适合用于文本数据?
A.同义词替换
B.随机删除句子中的词
C.旋转图像角度
D.回译(将文本翻译成其他语言再译回)
答案:C
解析:旋转图像是图像数据增强方法,文本数据增强需保持语义,如同义词替换、回译等。
13.评估回归模型时,“均方误差(MSE)”的计算公式是?
A.Σ|预测值真实值|/n
B.Σ(预测值真实值)2/n
C.1
您可能关注的文档
- 企业网络信息安全事件应急处置专项预案(精编版).docx
- 2024年工会知识竞赛题库及答案(精华版).docx
- 2025二级建造师提分模拟试题及答案.docx
- 2025国网职称考试题型及答案.docx
- 2025静脉输液标准试题及答案.docx
- 2025年艾滋病梅毒和乙肝母婴传播培训考试题(含答案).docx
- 2025年安全知识竞赛考试题库附答案.docx
- 2025年初中信息技术考试题库及答案.docx
- 2025年道路运输安全员两类人员试题库及答案.docx
- 2025年防洪防汛考试题及答案.docx
- 湖北省荆州市沙市中学2025-2026学年高一上学期12月月考语文试题.docx
- 吉林省长春市第二实验中学2025-2026学年高二上学期11月期中考试数学含解析.docx
- 四川省字节精准教育联盟2026届高中毕业班第一次诊断性检测政治.docx
- 四川省字节精准教育联盟2026届高中毕业班第一次诊断性检测政治答案.docx
- 物理试卷(A卷)答案山西省三重教育2025-2026学年高二12月阶段性检测(12.17-12.18).docx
- 物理试卷(A卷)山西省三重教育2025-2026学年高二12月阶段性检测(12.17-12.18).docx
- Unit1Reading2课件牛津译林版七年级英语下册.pptx
- 物理试卷(A卷)答案浙江省2025学年第一学期浙江北斗星盟高二年级12月阶段性联考(12.18-12.19).docx
- 四川省字节精准教育联盟2026届高中毕业班第一次诊断性检测语文.docx
- Unit1MynamesGina第3课时考点讲解writing16张.pptx
最近下载
- 旧路基层挖除的施工方案(3篇).docx VIP
- 量价分析图解.docx VIP
- ESG理论与实务—第九章 ESG投资市场.pptx VIP
- 量价分析图解.pdf VIP
- 众泰-T600-产品使用说明书-T600 2.0T 豪华型DCT-JNJ6460QT-T600车系使用手册20131201.pdf VIP
- ESG理论与实务—第一章 ESG概述.pptx VIP
- 赛默飞世尔AAS原理结构及操作使用 培训讲义.pptx
- DG TJ08-2240-2017 J13932-2017道路注浆加固技术规程.pdf VIP
- Agilent-GCMS培训(完整版330页)教程.ppt
- General Safety and Performance Requirements--XX 产品GSPR安全和性能基本要求检查表 MDR.docx VIP
原创力文档


文档评论(0)