2026年大数据分析技能强化与问题解析教材及配套练习.docxVIP

  • 1
  • 0
  • 约3.39千字
  • 约 12页
  • 2026-05-30 发布于福建
  • 举报

2026年大数据分析技能强化与问题解析教材及配套练习.docx

第PAGE页共NUMPAGES页

2026年大数据分析技能强化与问题解析教材及配套练习

一、单选题(共10题,每题2分)

1.在大数据分析中,以下哪种技术最适合处理海量、高速、非结构化的数据?

A.关系型数据库

B.MapReduce

C.机器学习

D.事务型数据库

2.以下哪个指标最能反映数据集的离散程度?

A.均值

B.中位数

C.标准差

D.方差

3.在Hadoop生态系统中,HDFS主要用于存储数据,而YARN主要用于什么?

A.数据处理

B.资源管理

C.数据分析

D.数据可视化

4.以下哪种算法不属于聚类算法?

A.K-means

B.DBSCAN

C.决策树

D.层次聚类

5.在数据预处理中,以下哪种方法最适合处理缺失值?

A.删除缺失值

B.插值法

C.熵权法

D.主成分分析

6.在Spark中,以下哪个操作属于RDD(弹性分布式数据集)的转换操作?

A.`map()`

B.`collect()`

C.`reduce()`

D.`filter()`

7.在数据挖掘中,关联规则挖掘的核心算法是?

A.Apriori

B.K-means

C.SVM

D.决策树

8.在大数据分析中,以下哪种模型最适合进行实时预测?

A.逻辑回归

B.神经网络

C.随机森林

D.流式模型

9.在

文档评论(0)

1亿VIP精品文档

相关文档