2026年国开电大大数据技术形考题库100道有答案.docxVIP

  • 1
  • 0
  • 约2.54万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道有答案.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、在大数据预处理中,以下哪种方法不属于处理缺失值的常用手段?

A.删除包含缺失值的记录

B.使用均值/中位数进行插补

C.直接忽略缺失数据

D.通过KNN算法预测缺失值

【答案】:C

解析:本题考察数据预处理中缺失值处理方法。常用缺失值处理方法包括A(删除)、B(统计量插补)、D(基于模型预测);C选项“直接忽略数据”不符合数据处理规范,会导致数据信息损失且缺乏系统性。因此正确答案为C。

2、在大数据数据清洗过程中,处理数据缺失值的常用方法包括以下哪些?

A.删除包含缺失值的样本

B.使用该特征的均值替换缺失值

C.使用KNN算法对缺失值进行插值

D.以上都是

【答案】:D

解析:本题考察大数据数据清洗中缺失值处理方法知识点。处理缺失值的方法包括:①直接删除样本(适用于缺失比例低的场景);②统计量替换(如均值、中位数);③机器学习算法插值(如KNN、线性回归);④基于业务规则填充。因此A、B、C均为常用方法,正确答案为D。

3、在Hadoop生态系统中,负责存储海量结构化与非结构化数据的核心组件是?

A.HDFS(分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.Spark(内存计算引擎)

【答案】:A

解析:本题考察Hadoop核心

文档评论(0)

1亿VIP精品文档

相关文档