2026年国开电大大数据技术概论形考题库100道及答案一套.docxVIP

  • 0
  • 0
  • 约2.47万字
  • 约 39页
  • 2026-03-10 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道及答案一套.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、Hadoop生态系统中负责分布式文件存储的核心组件是?

A.MapReduce

B.HDFS

C.YARN

D.Hive

【答案】:B

解析:本题考察Hadoop生态系统组件功能。HDFS(HadoopDistributedFileSystem)是Hadoop分布式文件系统,专为海量数据存储设计,将文件分割成块并分布式存储在多节点。选项AMapReduce是分布式计算框架;选项CYARN是资源管理器,负责集群资源调度;选项DHive是数据仓库工具,用于数据查询分析,均非文件存储组件。

2、在Hadoop生态系统中,负责分布式文件存储的核心组件是?

A.MapReduce

B.YARN

C.HDFS

D.Hive

【答案】:C

解析:本题考察Hadoop生态系统核心组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,用于存储海量数据,是Hadoop的核心存储组件,因此C选项正确。A选项MapReduce是分布式计算框架,B选项YARN是资源管理器,D选项Hive是数据仓库工具,均不属于分布式文件存储组件。

3、在大数据处理流程中,对数据进行缺失值填充、异常值处理的操作属于以下哪个环节?

A.数据清洗

B

文档评论(0)

1亿VIP精品文档

相关文档