2026年数据分析师等级考试题库大数据处理与分析技术要点.docxVIP

  • 1
  • 0
  • 约3.43千字
  • 约 12页
  • 2026-07-03 发布于福建
  • 举报

2026年数据分析师等级考试题库大数据处理与分析技术要点.docx

第PAGE页共NUMPAGES页

2026年数据分析师等级考试题库:大数据处理与分析技术要点

一、单选题(共10题,每题2分,合计20分)

1.在Hadoop生态系统中,HDFS主要用于存储大规模数据集,其设计特点不包括以下哪项?

A.高吞吐量,适合批处理场景

B.高可靠性,采用副本机制

C.低延迟访问,适合实时查询

D.分布式存储,支持跨节点数据冗余

2.Spark中,以下哪种模式最适合处理实时数据流?

A.RDD(弹性分布式数据集)

B.DataFrame

C.Dataset

D.StructuredStreaming

3.以下哪种数据库架构最适合处理大规模写入场景?

A.关系型数据库(如MySQL)

B.NoSQL数据库(如Cassandra)

C.NewSQL数据库(如TiDB)

D.时间序列数据库(如InfluxDB)

4.在数据清洗过程中,以下哪种方法不属于异常值处理技术?

A.箱线图分析

B.Z-score法

C.基于密度的聚类算法(DBSCAN)

D.热门商品推荐算法

5.以下哪种算法适用于分类问题,但通常不适合回归任务?

A.线性回归

B.决策树

C.神经网络

D.K-means聚类

6.在数据仓库中,以下哪种模型不属于星型模型的一部分?

A.事实表

B.维度表(星型)

C.聚合表

D.源

文档评论(0)

1亿VIP精品文档

相关文档