2026年数据科学和大数据技术专业考试题库.docxVIP

  • 0
  • 0
  • 约2.6千字
  • 约 12页
  • 2026-07-05 发布于福建
  • 举报

2026年数据科学和大数据技术专业考试题库.docx

第PAGE页共NUMPAGES页

2026年数据科学和大数据技术专业考试题库

一、单选题(每题2分,共20题)

1.在大数据处理中,Hadoop生态系统中的哪个组件主要用于分布式文件存储?

A.MapReduce

B.Hive

C.HDFS

D.YARN

答案:C

2.以下哪种算法不属于监督学习?

A.决策树

B.K-means聚类

C.逻辑回归

D.线性回归

答案:B

3.在数据预处理中,处理缺失值最常用的方法是什么?

A.删除缺失值

B.填充均值/中位数

C.插值法

D.以上都是

答案:D

4.以下哪种技术最适合实时大数据处理?

A.MapReduce

B.SparkStreaming

C.Hive

D.Flink

答案:D

5.在自然语言处理中,词嵌入技术主要解决什么问题?

A.文本分类

B.意图识别

C.词义消歧

D.实体抽取

答案:C

6.以下哪种数据库最适合高并发写入场景?

A.MySQL

B.MongoDB

C.Redis

D.PostgreSQL

答案:B

7.在机器学习模型评估中,过拟合现象最可能出现在哪种情况下?

A.模型复杂度过低

B.样本量不足

C.数据噪声较大

D.模型泛化能力强

答案:B

8.以下哪种模型适用于时间序列预测?

A.线性回归

B.ARIMA

C.逻

文档评论(0)

1亿VIP精品文档

相关文档