- 0
- 0
- 约2.6千字
- 约 12页
- 2026-07-05 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年数据科学和大数据技术专业考试题库
一、单选题(每题2分,共20题)
1.在大数据处理中,Hadoop生态系统中的哪个组件主要用于分布式文件存储?
A.MapReduce
B.Hive
C.HDFS
D.YARN
答案:C
2.以下哪种算法不属于监督学习?
A.决策树
B.K-means聚类
C.逻辑回归
D.线性回归
答案:B
3.在数据预处理中,处理缺失值最常用的方法是什么?
A.删除缺失值
B.填充均值/中位数
C.插值法
D.以上都是
答案:D
4.以下哪种技术最适合实时大数据处理?
A.MapReduce
B.SparkStreaming
C.Hive
D.Flink
答案:D
5.在自然语言处理中,词嵌入技术主要解决什么问题?
A.文本分类
B.意图识别
C.词义消歧
D.实体抽取
答案:C
6.以下哪种数据库最适合高并发写入场景?
A.MySQL
B.MongoDB
C.Redis
D.PostgreSQL
答案:B
7.在机器学习模型评估中,过拟合现象最可能出现在哪种情况下?
A.模型复杂度过低
B.样本量不足
C.数据噪声较大
D.模型泛化能力强
答案:B
8.以下哪种模型适用于时间序列预测?
A.线性回归
B.ARIMA
C.逻
您可能关注的文档
最近下载
- [机械标准]JBT 10226.1-2001 龙门铣床 精度检验.pdf VIP
- 急诊科优质护理计划.docx VIP
- SHT 3097-2017 石油化工静电接地设计规范.docx VIP
- 2025-2026年广东省普通高中学业水平考试地理真题汇编(必修一).pdf VIP
- 芬顿反应计算书.pptx VIP
- 小学一年级升二年级数学试卷.pdf VIP
- 2024极氪007用户手册CS1E_BEV_20231204_电子版1.pdf VIP
- 《低空经济》学习资料-题库-温州市继续教育-一般公需课.docx VIP
- 浙江省嘉兴市高一语文分班考试真题含答案.docx VIP
- 煤矿“五职矿长”和“五科技术员”岗位基本职责清单指南.docx VIP
原创力文档

文档评论(0)