- 2
- 0
- 约9.33千字
- 约 25页
- 2026-06-08 发布于上海
- 举报
数据科学家认证题库及答案
一、单项选择题(共10题,每题1分,共10分)
数据科学项目的标准核心流程顺序是以下哪一项?
A.需求分析、数据采集、数据预处理、模型开发、模型评估、部署迭代
B.数据采集、需求分析、模型开发、数据预处理、部署迭代、模型评估
C.模型开发、数据预处理、数据采集、需求分析、模型评估、部署迭代
D.需求分析、模型开发、数据采集、数据预处理、部署迭代、模型评估
答案:A
解析:工业界通用的数据科学项目流程以业务需求为起点,首先明确项目目标再开展后续工作,选项A符合常规逻辑。选项B、C、D均颠倒了核心流程的先后顺序,跳过业务需求直接处理数据或建模,大概率会出现技术方向与业务目标偏离的问题。
某数据集某特征的缺失值占比达35%,且该特征并非业务核心特征,此时最优的缺失值处理方式是?
A.直接删除该特征
B.使用该特征的均值填充缺失值
C.使用该特征的众数填充缺失值
D.使用线性插值法填充缺失值
答案:A
解析:缺失值占比超过30%时,任何填充方式都会引入大量人工噪声,干扰模型学习,非核心特征的情况下直接删除对整体效果影响最小。选项B、C、D均适用于缺失率低于10%的场景,高缺失率下使用会大幅降低数据质量。
医疗场景下的癌症筛查二分类任务中,为了尽可能避免漏诊(即实际患癌但被判定为健康),应优先关注以下哪个评估指标?
A.精确率
B.召回率
C.
您可能关注的文档
- 2026年绿色建筑咨询师考试题库(附答案和详细解析)(0513).docx
- Vue开发试题及解析.docx
- 一次误会的解决作文.docx
- 专四语法词汇题库及答案.docx
- 中医肝气郁结的饮食缓解方.docx
- 中学数学几何试题及解析.docx
- 中年男性护肝的食物选择.docx
- 中药与食物的配伍禁忌.docx
- 义齿佩戴后的口腔清洁.docx
- 仲裁员仲裁法试题及解析.docx
- 20260605_水文与投产共振,分红与成长同频.pdf
- 中国中式养生水行业发展趋势洞察报告(2026).pdf
- 两岸融合发展文化与传播指数(2026).pdf
- 国家高性能医疗器械创新中心:高性能医疗器械2025年度创新发展报告.pdf
- BRAF突变甲状腺癌流行病学和精准诊疗白皮书(2026版).pdf
- 20260605_电子行业研究周报:华为发布韬定律,存储景气延续.pdf
- 20260605_有色金属央企2025&2026Q1财报跟踪:业绩盈利稳健,产业格局优化引领配置价值.pdf
- 麦肯锡咨询资料 survey input for legend2.pdf
- 麦肯锡咨询资料 SYC - CDD(F) - Field mapping 018.pdf
- 麦肯锡咨询资料 Rolling(H Oil).pdf
原创力文档

文档评论(0)