2026年大数据应用与技术原理问题库.docxVIP

  • 1
  • 0
  • 约3.47千字
  • 约 14页
  • 2026-06-03 发布于福建
  • 举报

第PAGE页共NUMPAGES页

2026年大数据应用与技术原理问题库

一、单选题(每题2分,共20题)

1.在大数据环境中,Hadoop生态系统中负责数据存储的核心组件是?

A.MapReduce

B.Hive

C.HDFS

D.YARN

2.以下哪种数据挖掘技术最适用于发现数据中的隐藏模式?

A.聚类分析

B.回归分析

C.关联规则学习

D.分类算法

3.在分布式计算中,Spark的RDD(弹性分布式数据集)主要优势在于?

A.支持实时数据处理

B.可容错性

C.高层次抽象

D.低延迟

4.NoSQL数据库中,MongoDB采用的数据模型是?

A.关系型模型

B.列式存储

C.文档型存储

D.键值对存储

5.大数据分析中,3V特征不包括以下哪一项?

A.数据量(Volume)

B.速度(Velocity)

C.变异(Variety)

D.可用性(Availability)

6.以下哪种算法最适合用于异常检测任务?

A.决策树

B.K-Means

C.孤立森林(IsolationForest)

D.朴素贝叶斯

7.在数据预处理阶段,以下哪种方法主要用于处理缺失值?

A.数据插补

B.数据归一化

C.特征编码

D.数据分箱

8.云计算平台中,AWS的EMR服务主要支持哪种大数据处理框架?

A.

文档评论(0)

1亿VIP精品文档

相关文档