2026年大数据技术与应用问题详解集.docxVIP

  • 2
  • 0
  • 约3.51千字
  • 约 14页
  • 2026-06-05 发布于福建
  • 举报

第PAGE页共NUMPAGES页

2026年大数据技术与应用问题详解集

一、单选题(每题2分,共20题)

说明:本部分主要考察大数据基础理论、技术原理及行业应用场景的理解。

1.在大数据生态中,Hadoop的核心组件不包括以下哪项?

A.HDFS

B.YARN

C.Spark

D.MapReduce

2.以下哪种数据挖掘算法不属于分类算法?

A.决策树

B.K近邻(KNN)

C.K-means聚类

D.支持向量机(SVM)

3.NoSQL数据库中,Redis最常用于哪种场景?

A.分布式文件存储

B.高性能缓存

C.图数据库

D.时间序列数据库

4.以下哪个工具主要用于实时大数据处理?

A.Hive

B.Flink

C.SparkSQL

D.HBase

5.在数据预处理中,缺失值处理的方法不包括?

A.删除缺失值

B.均值/中位数填充

C.回归预测填充

D.数据加密

6.以下哪种技术不属于数据集成阶段?

A.数据清洗

B.数据转换

C.数据加载

D.数据压缩

7.MapReduce模型中,Map阶段的主要功能是?

A.对数据进行排序

B.对数据进行过滤

C.将输入数据转换为键值对

D.执行全局聚合

8.在大数据安全中,以下哪项不属于数据脱敏技术?

A.数据掩码

B.数据泛化

C.数据加密

文档评论(0)

1亿VIP精品文档

相关文档