2026年国开电大大数据技术概论形考题库100道及参考答案【b卷】.docxVIP

  • 1
  • 0
  • 约2.46万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道及参考答案【b卷】.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、以下关于数据仓库的描述,正确的是?

A.数据仓库仅用于存储实时产生的业务数据

B.数据仓库的数据通常支持联机事务处理(OLTP)

C.数据仓库是面向主题的、集成的、非易失的数据集

D.数据仓库的数据仅包含结构化数据,不包含非结构化数据

【答案】:C

解析:本题考察数据仓库定义知识点。数据仓库是面向主题(针对特定业务需求)、集成(整合多源数据)、非易失(数据一般不频繁修改)、时变(随时间演化)的数据集,用于支持管理决策,因此C正确。A错误,数据仓库数据多为批处理生成,非实时;B错误,数据仓库主要支持OLAP(联机分析处理),而非OLTP(事务处理);D错误,数据仓库可包含结构化、半结构化、非结构化数据。

2、Hadoop生态系统中用于存储海量数据的分布式文件系统是?

A.HDFS

B.MapReduce

C.YARN

D.Hive

【答案】:A

解析:本题考察Hadoop核心组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop生态系统的分布式文件系统,负责海量数据的存储;MapReduce是分布式计算框架,YARN是资源管理器,Hive是基于Hadoop的数据仓库工具。因此正确答案为A。

3、以下哪项是大数据区别于传统数据处理的典型特

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档