大模型训练数据清洗标注技师考试试卷及答案.docVIP

  • 1
  • 0
  • 约2.38千字
  • 约 6页
  • 2026-05-19 发布于山东
  • 举报

大模型训练数据清洗标注技师考试试卷及答案.doc

大模型训练数据清洗标注技师考试试卷及答案

试题部分

一、填空题(每题1分,共10分)

1.常用开源标注工具除Labelbox、Prodigy外,还有______

2.数据清洗中重复数据的核心处理方法是______和合并去重

3.NER标注任务的全称是______

4.标注的核心原则包括客观性、一致性和______

5.大模型训练数据清洗的第一步是______

6.标注歧义处理需遵循______优先原则

7.文本数据去除特殊符号属于______清洗

8.图像目标检测标注框常见格式是______

9.标注质量控制的方法有抽检、复核和______

10.大模型训练数据需满足高质量、多样性和______

二、单项选择题(每题2分,共20分)

1.以下不属于数据清洗步骤的是?

A.数据收集B.数据去重C.数据标注D.数据验证

2.标注矛盾优先参考的是?

A.个人经验B.业务规则C.他人结果D.口头要求

3.属于序列标注的任务是?

A.图像分类B.实体识别C.目标检测D.图像分割

4.缺失值处理不包括的方法是?

A.删除行B.填充均值C.填充众数D.随机生成

5.标注的主要目的是?

A.提高美观度B.提供监督信号C.减少数据量D.简化格式

6.开源免费的标注工具是?

A.LabelStudioB.LabelboxC.ProdigyD.SageMakerGroundTruth

7.标注一致性的核

文档评论(0)

1亿VIP精品文档

相关文档