2026年大数据分析师高级考试模拟试卷.docxVIP

  • 0
  • 0
  • 约7.89千字
  • 约 11页
  • 2026-06-02 发布于湖北
  • 举报

2026年大数据分析师高级考试模拟试卷.docx

2026年大数据分析师高级考试模拟试卷

考试时间:______分钟总分:______分姓名:______

一、选择题(每题2分,共30分)

1.在大数据处理架构中,下列哪一项不是Hadoop生态系统核心组件?

A.HDFS

B.YARN

C.Spark

D.Hive

2.相比于MapReduce,Spark的核心优势之一是?

A.严格容错

B.更高的数据本地性

C.仅适用于批处理

D.更低的资源利用率

3.下列关于ApacheKafka的描述,错误的是?

A.支持高吞吐量的消息队列

B.适用于分布式流处理

C.自然分区(Partition)和复制(Replication)机制

D.主要用于事务性数据库数据同步

4.在分布式数据库设计中,星型模式通常包含一个中心事实表和多个维度表。下列哪个指标不属于星型模式的优势?

A.查询效率高

B.易于理解

C.维护复杂度高

D.扩展性好

5.下列哪种数据挖掘任务最适合用于发现数据项之间隐藏的关联规则?

A.聚类分析

B.分类预测

C.关联规则挖掘

D.回归分析

6.在Spark中,RDD的持久化(Pers

文档评论(0)

1亿VIP精品文档

相关文档