2026年数据科学基础知识与实践操作测试题.docxVIP

  • 1
  • 0
  • 约4.76千字
  • 约 15页
  • 2026-05-29 发布于福建
  • 举报

2026年数据科学基础知识与实践操作测试题.docx

第PAGE页共NUMPAGES页

2026年数据科学基础知识与实践操作测试题

一、单选题(共10题,每题2分,合计20分)

1.在数据预处理阶段,以下哪种方法最适合处理缺失值?()

A.删除含有缺失值的样本

B.使用均值或中位数填充

C.使用模型预测缺失值

D.以上均不适用

2.以下哪种算法属于非监督学习?()

A.逻辑回归

B.决策树

C.K-means聚类

D.线性回归

3.在特征工程中,特征交叉通常指什么?()

A.对特征进行归一化

B.创建新的特征组合(如AB)

C.特征选择

D.特征降维

4.以下哪种指标最适合评估分类模型的性能,尤其是在类别不平衡的情况下?()

A.准确率

B.F1分数

C.AUC-ROC

D.MAE

5.在时间序列分析中,ARIMA模型的主要应用场景是什么?()

A.图像识别

B.站点流量预测

C.文本生成

D.自然语言处理

6.以下哪种数据库最适合存储结构化数据?()

A.NoSQL数据库(如MongoDB)

B.关系型数据库(如MySQL)

C.搜索引擎(如Elasticsearch)

D.图数据库(如Neo4j)

7.在机器学习模型调参中,网格搜索的主要缺点是什么?()

A.计算效率高

B.容易陷入局部最优

C.可并行化执行

D.不支持交叉验证

8.

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档