2026年大数据分析工程师认证考试真题(中级).docxVIP

  • 0
  • 0
  • 约1.18万字
  • 约 18页
  • 2026-03-14 发布于河南
  • 举报

2026年大数据分析工程师认证考试真题(中级).docx

2026年大数据分析工程师认证考试真题(中级)

考试时间:______分钟总分:______分姓名:______

一、选择题(每题只有一个正确答案,请将正确选项字母填入括号内。每题2分,共30分)

1.下列哪一项不是大数据的“5V”特征?()

A.Volume(海量性)

B.Velocity(高速性)

C.Variety(多样性)

D.Veracity(真实性)

E.Value(价值性)

2.在Hadoop生态系统中,负责管理集群资源分配的组件是?()

A.HDFS

B.MapReduce

C.YARN

D.Hive

3.以下哪种类型的数据库通常适用于存储结构化、关系型的数据?()

A.NoSQL数据库

B.数据仓库

C.数据湖

D.搜索引擎索引

4.下列关于数据清洗的描述,错误的是?()

A.缺失值处理是数据清洗的重要步骤

B.数据集成是指将多个数据源的数据合并到一个数据集中

C.数据变换包括数据规范化、编码转换等操作

D.异常值检测总是需要删除检测到的所有异常值

5.适用于分析用户购买商品序列,发现频繁项集的算法是?()

A.K-Means聚类算法

B.决策树分类算法

C.Apriori关联规则算法

D.线性回归算法

6.以下哪个工具通常不用于数据可视化?()

A.Tableau

B.PowerBI

C.TensorFlow

D.ECharts

7.在大数据处理中,SparkSQL主要用于?()

A.实时流处理

B.SQL查询和数据分析

C.分布式文件存储

D.图计算

8.下列关于数据仓库的描述,错误的是?()

A.数据仓库是面向主题的

B.数据仓库的数据是集成的

C.数据仓库的数据是稳定的

D.数据仓库的数据主要来源于操作型数据库

9.以下哪种技术可以用于实现不同来源、不同结构数据的统一存储和管理?()

A.NoSQL数据库

B.数据湖

C.数据仓库

D.数据集市

10.在进行数据探索性分析时,常用的统计量不包括?()

A.均值

B.中位数

C.方差

D.熵值

11.下列关于MapReduce编程模型的描述,错误的是?()

A.Map阶段负责对输入数据进行扫描和转换

B.Reduce阶段负责对Map阶段输出的键值对进行聚合

C.Map和Reduce阶段必须串行执行

D.MapReduce模型适合处理大规模数据集

12.以下哪种方法不属于数据预处理中的数据集成技术?()

A.数据去重

B.数据合并

C.数据变换

D.数据规范化

13.当需要分析大规模日志数据,并需要对数据进行实时处理时,可能会选用?()

A.Hive

B.HBase

C.SparkStreaming

D.Elasticsearch

14.下列关于云原生大数据平台的描述,错误的是?()

A.通常基于微服务架构

B.可以提供弹性的资源扩展

C.部署和管理相对复杂

D.成本通常较低

15.保障大数据系统安全的重要措施之一是?()

A.数据加密

B.数据压缩

C.数据备份

D.数据分区

二、多选题(每题有多个正确答案,请将正确选项字母填入括号内。每题3分,共30分)

1.大数据的主要特征包括?()

A.海量性

B.高速性

C.多样性

D.低成本

E.价值性

2.Hadoop生态系统中的主要组件有哪些?()

A.HDFS

B.MapReduce

C.YARN

D.Hive

E.Flume

3.数据预处理的主要任务包括?()

A.数据清洗

B.数据集成

C.数据变换

D.数据规约

E.数据可视化

4.以下哪些属于常用的机器学习算法?()

A.决策树

B.线性回归

C.K-Means聚类

D.Apriori关联

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档