大模型训练数据清洗师岗位招聘考试试卷及答案.docVIP

  • 0
  • 0
  • 约2.73千字
  • 约 5页
  • 2026-01-26 发布于山东
  • 举报

大模型训练数据清洗师岗位招聘考试试卷及答案.doc

大模型训练数据清洗师岗位招聘考试试卷及答案

试卷部分

一、填空题(共10题,每题1分)

1.大模型训练数据清洗中,去除重复样本的常用方法有______、基于相似度去重等。

2.数据清洗的基本步骤包括数据预处理、______、缺失值处理、异常值处理等。

3.处理数值型缺失值常用的填充方法有均值填充、中位数填充、______等。

4.大模型训练数据需满足的核心要求包括准确性、______、时效性、安全性。

5.文本数据清洗中,去除HTML标签常用的工具是______、正则表达式。

6.数据一致性检查的目的是确保数据的______、格式一致性。

7.处理分类变量缺失值常用的填充方法有众数填充、___

文档评论(0)

1亿VIP精品文档

相关文档