2026年湖南省数字技术应用能力水平(大数据基础知识及应用)全真模拟试题及答案.docxVIP

  • 2
  • 0
  • 约1.17万字
  • 约 25页
  • 2026-06-03 发布于四川
  • 举报

2026年湖南省数字技术应用能力水平(大数据基础知识及应用)全真模拟试题及答案.docx

2026年湖南省数字技术应用能力水平(大数据基础知识及应用)全真模拟试题及答案

一、单项选择题(每题2分,共40分)

1.大数据技术体系中,负责对海量数据进行分布式处理的框架是()。

A.HDFS

B.MapReduce

C.HBase

D.ZooKeeper

答案:B

解析:MapReduce是Hadoop的核心计算框架,它将计算任务分解成Map(映射)和Reduce(归约)两个阶段,实现了对海量数据的并行处理。HDFS是分布式文件系统,负责存储;HBase是分布式列式数据库;ZooKeeper是分布式协调服务。

2.以下关于数据仓库与数据库主要区别的描述,不正确的是()。

A.数据库面向事务处理,数据仓库面向主题分析

B.数据库数据通常需要频繁更新,数据仓库数据相对稳定

C.数据库数据是详细的、当前的,数据仓库数据是集成的、历史的

D.数据库通常采用行式存储,数据仓库只能采用列式存储

答案:D

解析:数据仓库的存储方式并非固定,传统数据仓库多采用行式存储,而现代大数据环境下的数据仓库(如HiveonHDFS)或分析型数据库(如ClickHouse)常采用列式存储以提高分析查询效率,但“只能采用”的说法是错误的。

3.在数据预处理中,用于处理数据集中由于各种原因导致的数据值缺失的技术是()。

A.数据集成

B.数据规约

C.数据清

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档