数据科学家认证题库及答案.docxVIP

  • 2
  • 0
  • 约9.33千字
  • 约 25页
  • 2026-06-08 发布于上海
  • 举报

数据科学家认证题库及答案

一、单项选择题(共10题,每题1分,共10分)

数据科学项目的标准核心流程顺序是以下哪一项?

A.需求分析、数据采集、数据预处理、模型开发、模型评估、部署迭代

B.数据采集、需求分析、模型开发、数据预处理、部署迭代、模型评估

C.模型开发、数据预处理、数据采集、需求分析、模型评估、部署迭代

D.需求分析、模型开发、数据采集、数据预处理、部署迭代、模型评估

答案:A

解析:工业界通用的数据科学项目流程以业务需求为起点,首先明确项目目标再开展后续工作,选项A符合常规逻辑。选项B、C、D均颠倒了核心流程的先后顺序,跳过业务需求直接处理数据或建模,大概率会出现技术方向与业务目标偏离的问题。

某数据集某特征的缺失值占比达35%,且该特征并非业务核心特征,此时最优的缺失值处理方式是?

A.直接删除该特征

B.使用该特征的均值填充缺失值

C.使用该特征的众数填充缺失值

D.使用线性插值法填充缺失值

答案:A

解析:缺失值占比超过30%时,任何填充方式都会引入大量人工噪声,干扰模型学习,非核心特征的情况下直接删除对整体效果影响最小。选项B、C、D均适用于缺失率低于10%的场景,高缺失率下使用会大幅降低数据质量。

医疗场景下的癌症筛查二分类任务中,为了尽可能避免漏诊(即实际患癌但被判定为健康),应优先关注以下哪个评估指标?

A.精确率

B.召回率

C.

文档评论(0)

1亿VIP精品文档

相关文档