数据科学题目及分析.docxVIP

  • 2
  • 0
  • 约9.34千字
  • 约 24页
  • 2026-06-15 发布于江苏
  • 举报

数据科学题目及分析

一、单项选择题(共10题,每题1分,共10分)

数据科学项目标准流程的首个环节是以下哪一项?

A.数据清洗

B.数据采集

C.模型训练

D.结果可视化

答案:B

解析:数据科学项目的流程需从获取原始数据开始,因此首个环节是数据采集。选项A数据清洗属于数据预处理环节,是采集完成后的步骤;选项C模型训练是建模阶段的核心操作,需在预处理完成后开展;选项D结果可视化是项目输出环节的工作,处于流程末端。

以下哪种缺失值处理方法不属于插值类方法?

A.均值填充

B.中位数填充

C.删除含缺失值的行

D.K近邻填充

答案:C

解析:插值类方法的核心是通过规则补全缺失值,而删除含缺失值的行是直接舍弃不完整样本,没有补全操作,不属于插值方法。其余三个选项均是通过不同规则生成合理值填充缺失位置,属于插值类方法。

以下哪种算法属于监督学习范畴?

A.K均值聚类

B.决策树分类

C.主成分分析

D.关联规则挖掘

答案:B

解析:监督学习的核心是需要带标注的目标变量用于训练,决策树分类需要标注好的分类标签训练模型,属于监督学习。其余三个选项均属于无监督学习,训练过程不需要标注的目标变量。

二分类场景中,实际为正样本的样本被模型预测为负样本的情况对应的指标是?

A.精确率

B.召回率

C.假阳率

D.假阴率

答案:D

解析:假阴率的定义就是真实为正、预测为负

文档评论(0)

1亿VIP精品文档

相关文档