2026年国开电大大数据技术概论形考题库100道【培优】.docxVIP

  • 1
  • 0
  • 约2.45万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道【培优】.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、在Hadoop生态系统中,用于高吞吐量数据实时采集的工具是?

A.Flume

B.Sqoop

C.Kafka

D.Hive

【答案】:C

解析:本题考察Hadoop生态系统工具的功能。Flume主要用于日志等非结构化数据的批量采集;Sqoop是数据导入导出工具,用于Hadoop与关系型数据库间的数据传输;Kafka是高吞吐量的分布式消息队列,适合实时数据采集场景;Hive是数据仓库工具,用于数据查询与分析。因此选C。

2、大数据的‘4V’特征中,‘指数据类型的多样性,包括结构化、半结构化和非结构化数据’的是以下哪一项?

A.Volume(数据量大)

B.Velocity(处理速度快)

C.Variety(数据类型多样)

D.Value(价值密度低)

【答案】:C

解析:本题考察大数据的4V特征定义。正确答案为C:Variety特指数据类型的多样性,涵盖结构化(如数据库表)、半结构化(如XML)和非结构化(如文本、图片)数据。A选项Volume指数据规模巨大(PB级);B选项Velocity强调数据产生与处理速度快(需实时/近实时处理);D选项Value指数据价值密度低,需通过挖掘提取价值。因此C符合题意。

3、Hadoop生态系统中,负责分布式数据存储的核心组件是?

A.Ma

文档评论(0)

1亿VIP精品文档

相关文档