2026年大数据技术与数据挖掘应用认证题库.docxVIP

  • 1
  • 0
  • 约3.88千字
  • 约 14页
  • 2026-07-04 发布于福建
  • 举报

2026年大数据技术与数据挖掘应用认证题库.docx

第PAGE页共NUMPAGES页

2026年大数据技术与数据挖掘应用认证题库

一、单选题(每题2分,共20题)

说明:每题只有一个正确答案。

1.在大数据环境中,Hadoop生态系统中负责数据存储的核心组件是?

A.Hive

B.HDFS

C.Spark

D.YARN

2.以下哪种算法不属于监督学习算法?

A.决策树

B.K-Means聚类

C.逻辑回归

D.线性回归

3.在数据预处理中,处理缺失值常用的方法不包括?

A.删除含有缺失值的行

B.均值/中位数/众数填充

C.使用模型预测缺失值

D.对缺失值进行随机插值

4.下列哪个指标不适合用来评估分类模型的性能?

A.准确率

B.召回率

C.F1分数

D.决策树深度

5.在时间序列分析中,ARIMA模型适用于哪种类型的数据?

A.分类数据

B.离散数据

C.平稳时间序列

D.非线性数据

6.大数据技术中,以下哪种存储方式最适合处理海量、稀疏数据?

A.关系型数据库

B.列式存储(如HBase)

C.键值存储(如Redis)

D.对象存储

7.在数据挖掘过程中,特征选择的主要目的是?

A.提高模型训练速度

B.增加数据维度

C.减少噪声干扰

D.提升模型可解释性

8.以下哪种技术不属于分布式计算框架?

A.ApacheFlink

B.Tens

文档评论(0)

1亿VIP精品文档

相关文档