2026年高职(大数据分析与应用)数据预处理技术阶段测试题及答案.docxVIP

  • 0
  • 0
  • 约5.09千字
  • 约 13页
  • 2026-03-26 发布于湖北
  • 举报

2026年高职(大数据分析与应用)数据预处理技术阶段测试题及答案.docx

2026年高职(大数据分析与应用)数据预处理技术阶段测试题及答案

一、单项选择题(本大题共10小题,每小题2分,共20分。每小题只有一个正确选项)

1.以下哪种方法不属于缺失值的处理方法?

A.均值插补法

B.回归插补法

C.直接删除含缺失值的记录

D.主成分分析(PCA)

2.数据中由于测量误差或设备故障导致的不合理值被称为:

A.缺失值

B.噪声数据

C.重复数据

D.不一致数据

3.若某变量数据范围为[10,50],采用MinMax归一化将其映射到[0,1],则数据点30的归一化结果为:

A.0.5

B.0.4

C.0.6

D.0.3

4.数据集成时,不同数据源中“出生日期”字段分别存储为“YYYYMMDD”和“DD/MM/YYYY”,这种冲突属于:

A.结构冲突

B.语义冲突

C.命名冲突

D.类型冲突

5.数据归约的主要目的是:

A.提高数据的准确性

B.减少数据量,同时保留关键信息

C.消除数据中的噪声

D.增加数据的维度

6.将连续型变量“年龄”划分为“018岁”“1935岁”“3660岁”“60岁以上”,这种离散化方法属于:

A.等频法

B.等宽法

C.基于聚类的离散化

D.决策树离散化

文档评论(0)

1亿VIP精品文档

相关文档