2026年国开电大大数据技术形考题库100道附答案(达标题).docxVIP

  • 0
  • 0
  • 约2.5万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道附答案(达标题).docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、在大数据处理流程中,以下哪个步骤主要用于处理数据中的缺失值、异常值和重复值?

A.数据清洗

B.数据集成

C.数据转换

D.数据规约

【答案】:A

解析:本题考察大数据预处理步骤知识点。数据清洗的核心任务是处理数据质量问题,包括缺失值填充、异常值修正、重复值删除等;数据集成是合并多源数据,数据转换是调整数据格式,数据规约是降低数据规模。因此正确答案为A。

2、大数据的哪个特征体现了数据产生和处理的速度要求?

A.Volume(数据量)

B.Velocity(速度)

C.Variety(多样性)

D.Value(价值密度)

【答案】:B

解析:本题考察大数据的5V特征知识点。大数据的5V特征中,Velocity(速度)特指数据产生和处理的速度要求,例如实时流数据的快速处理;Volume(A选项)指数据量大小,强调数据规模;Variety(C选项)指数据类型多样(结构化、半结构化、非结构化);Value(D选项)指数据价值密度低,需通过分析挖掘价值。因此正确答案为B。

3、Hadoop生态系统中,负责分布式数据存储的核心组件是?

A.MapReduce

B.YARN

C.HDFS

D.Hive

【答案】:C

解析:HDFS(HadoopDistributedFileSys

文档评论(0)

1亿VIP精品文档

相关文档