- 2
- 0
- 约3.32千字
- 约 13页
- 2026-06-26 发布于江苏
- 举报
2025最新大数据分析师数据清洗试题及答案
一、单项选择题(总共10题,每题2分)
1.在数据清洗过程中,以下哪一项不属于数据预处理的主要步骤?
A.数据格式化
B.数据集成
C.数据变换
D.数据挖掘
答案:D
2.当处理缺失值时,以下哪种方法通常适用于连续型数据?
A.删除含有缺失值的记录
B.使用平均值填充
C.使用众数填充
D.使用分类算法预测
答案:B
3.在数据清洗中,以下哪一项不是异常值检测的方法?
A.箱线图法
B.Z分数法
C.空间聚类法
D.相关性分析法
答案:D
4.数据标准化和归一化的主要区别在于?
A.标准化使用均值和标准差,归一化使用最小值和最大值
B.标准化适用于分类数据,归一化适用于数值数据
C.标准化不改变数据的分布,归一化会改变数据的分布
D.标准化适用于小数据集,归一化适用于大数据集
答案:A
5.在处理重复数据时,以下哪一项是正确的做法?
A.保留所有重复数据
B.删除所有重复数据
C.只删除部分重复数据
D.标记重复数据但不删除
答案:B
6.数据清洗中,以下哪一项不是数据一致性的问题?
A.数据类型不一致
B.数据格式不一致
C.数据值域不一致
D.数据采集方法不一致
答案:D
7.在数据清洗过程中,以下哪一项是数据验证的主要目的?
A.提高数据质量
B.减少数据量
C
您可能关注的文档
最近下载
- 农业知识综合四真题试卷及答案.docx VIP
- 英语泛读教程 2 (第四版)刘乃银课后习题答案.pdf
- BRC消费品管理体系全套文件 第四版20171201.docx
- 2023年春人文英语4综合练习(Comprehensive Test) 题库1及答案.pdf
- 2025年(制药工程)制药工艺设计试题及答案.pdf VIP
- 浙江传媒学院线性代数期末试题.doc VIP
- 土壤最大干密度与最佳含水量试验报告(自动计算).xls VIP
- 生产车间操作规程试题附答案.docx VIP
- 多元统计分析及R语言建模(暨南大学)中国大学MOOC慕课 章节测验期末考试答案.docx VIP
- DB32T 4290-2022 特种设备用流量计(壳体)安全技术条件.pdf VIP
原创力文档

文档评论(0)