2026年大数据技术与算法基础解析.docxVIP

  • 1
  • 0
  • 约4.26千字
  • 约 15页
  • 2026-06-07 发布于福建
  • 举报

第PAGE页共NUMPAGES页

2026年大数据技术与算法基础解析

一、单选题(每题2分,共20题)

1.在大数据处理中,Hadoop的核心组件HDFS的主要功能是?

A.实时数据流处理

B.分布式文件存储

C.图数据库管理

D.数据挖掘算法执行

2.下列哪种算法不属于监督学习算法?

A.决策树

B.K-means聚类

C.线性回归

D.逻辑回归

3.在分布式计算框架中,Spark的RDD(弹性分布式数据集)的主要优势是?

A.支持实时查询

B.支持持久化存储

C.弹性容错能力

D.低延迟交互

4.以下哪种技术最适合处理海量、高维度的数据特征降维?

A.主成分分析(PCA)

B.K近邻算法

C.决策树剪枝

D.神经网络训练

5.在大数据存储中,NoSQL数据库MongoDB的主要特点是什么?

A.强一致性事务支持

B.列式存储优化

C.文档型数据存储

D.关系型数据模型

6.下列哪种数据挖掘任务最适合用于发现数据中的异常模式?

A.关联规则挖掘

B.聚类分析

C.异常检测

D.分类预测

7.在大数据处理中,MapReduce模型的核心思想是?

A.数据分治与并行处理

B.内存优化

C.实时数据流

D.图计算

8.以下哪种算法在处理稀疏数据时表现较差?

A.逻辑回归

B.支持向量机(SVM)

文档评论(0)

1亿VIP精品文档

相关文档