- 5
- 0
- 约4.57千字
- 约 9页
- 2026-03-07 发布于河南
- 举报
大数据培训面试数据处理题目及答案
一、单选题(每题1分,共10分)
1.下列哪种数据类型通常用于表示文本信息?()
A.数值型B.类别型C.日期型D.布尔型
【答案】B
【解析】类别型数据通常用于表示文本信息,如性别、城市等。
2.在数据预处理中,处理缺失值的一种常用方法是?()
A.删除含有缺失值的行B.填充缺失值C.忽略缺失值D.以上都是
【答案】D
【解析】处理缺失值的方法包括删除含有缺失值的行、填充缺失值和忽略缺失值。
3.数据聚合操作通常用于?()
A.增加数据维度B.减少数据维度C.合并数据D.筛选数据
【答案】C
【解析】数据聚合操作通常用于合并数据,如按某个字段进行分组统计。
4.下列哪种方法可以用来减少数据的维度?()
A.主成分分析(PCA)B.线性回归C.决策树D.聚类分析
【答案】A
【解析】主成分分析(PCA)是一种常用的降维方法。
5.在数据清洗过程中,处理异常值的一种常用方法是?()
A.删除异常值B.修正异常值C.忽略异常值D.以上都是
【答案】D
【解析】处理异常值的方法包括删除异常值、修正异常值和忽略异常值。
6.数据标准化通常用于?()
A.增加数据量B.减少数据量C.统一数据尺度D.改变数据分布
【答案】C
【解
原创力文档

文档评论(0)