2026年大数据技术工程技术师考试试卷及答案解析（初级水平）.docxVIP

下载本文档

0
0
约9.08千字
约 18页
2026-03-14 发布于河南
举报

2026年大数据技术工程技术师考试试卷及答案解析（初级水平）.docx

2026年大数据技术工程技术师考试试卷及答案解析（初级水平）

考试时间：______分钟总分：______分姓名：______

一、单项选择题（每题1分，共30分。下列每题只有一个选项是正确的，请将正确选项的字母填在括号内。）

1.大数据通常指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，其大小超出了传统数据库软件工具的能力范围。以下哪个不是大数据的典型特征？（）

A.海量性（Volume）

B.速度性（Velocity）

C.多样性（Variety）

D.价值性（Value）

E.实时性（Real-time）

2.大数据处理的4V特点不包括以下哪一项？（）

A.Volume（容量）

B.Velocity（速度）

C.Variety（多样性）

D.Veracity（真实性）

E.Value（价值）

3.下列哪种存储模型最适合存储非结构化数据？（）

A.关系型数据库

B.NoSQL数据库

C.数据仓库

D.搜索引擎

4.Hadoop生态系统中的YARN负责什么？（）

A.数据存储

B.资源管理和任务调度

C.数据处理

D.数据查询

5.Hadoop分布式文件系统（HDFS）的主要特点是？（）

A.高度容错、适合批处理

B.低延迟、实时查询

C.分布式存储、高可用性

D.关系型数据存储

6.下列哪个组件是Hadoop生态系统中的数据仓库工具？（）

A.HDFS

B.YARN

C.MapReduce

D.Hive

7.下列哪个组件是Hadoop生态系统中的分布式数据库，提供对大规模数据集的随机实时读/写访问？（）

A.HDFS

B.YARN

C.MapReduce

D.HBase

8.MapReduce模型中，Map阶段的主要功能是？（）

A.对数据进行排序和合并

B.对原始数据进行处理，生成键值对

C.将数据写入到HDFS

D.对处理后的数据进行查询

9.Reduce阶段的主要功能是？（）

A.对原始数据进行处理，生成键值对

B.对数据进行排序和合并

C.将数据写入到HDFS

D.对处理后的数据进行查询

10.下列哪个不是Hadoop生态系统中的组件？（）

A.HDFS

B.YARN

C.Spark

D.Zookeeper

11.Spark的核心数据结构是？（）

A.数据表

B.数据库

C.RDD（弹性分布式数据集）

D.文件

12.Spark与HadoopMapReduce相比，其主要优势是？（）

A.只能处理结构化数据

B.无法进行内存计算

C.支持更丰富的数据处理功能，性能更高

D.只能运行在Hadoop集群上

13.SparkSQL主要用于什么？（）

A.数据采集

B.数据查询

C.数据存储

D.数据处理

14.SparkStreaming主要用于处理什么类型的数据流？（）

A.批量数据

B.实时数据流

C.结构化数据

D.非结构化数据

15.下列哪个不是Spark的组件？（）

A.SparkCore

B.SparkSQL

C.SparkStreaming

D.Hive

16.下列哪个不是NoSQL数据库的类型？（）

A.关系型数据库

B.键值存储

C.列式存储

D.图数据库

17.数据仓库的特点不包括以下哪一项？（）

A.面向主题

B.稳定

C.集成

D.时变

18.数据挖掘的主要目的是？（）

A.数据存储

B.数据查询

C.从大量数据中发现有价值的模式和规律

D.数据采集

19.以下哪个不是常用的数据挖掘技术？（）

A.分类

B.聚类

C.关联规则

D.准备分析

20.以下哪个不是数据仓库的常用技术？（）

A.ETL

B.OLAP

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

2026年大数据技术工程技术师考试试卷及答案解析（初级水平）.docxVIP