- 2
- 0
- 约1.13万字
- 约 26页
- 2026-06-25 发布于上海
- 举报
数据科学家题库及分析
一、单项选择题(共10题,每题1分,共10分)
下列关于数据科学项目核心流程的表述,正确的是
A.数据科学项目的核心流程为数据获取、业务理解、数据预处理、建模分析、评估部署
B.数据科学项目的核心流程为业务理解、数据获取、数据预处理、建模分析、评估部署
C.数据科学项目的核心流程为数据获取、数据预处理、业务理解、建模分析、评估部署
D.数据科学项目的核心流程为业务理解、建模分析、数据获取、数据预处理、评估部署
答案:B
解析:业务理解是数据科学项目的首要前提,需要先明确项目目标、业务需求再开展后续工作,否则容易出现工作偏离实际需求的问题。A、C选项将业务理解放在数据获取之后,会导致数据采集缺乏明确方向,浪费资源;D选项将建模分析放在数据获取之前,不符合数据驱动建模的基本逻辑。
下列场景中,最不适合采用均值填充法处理数值型变量缺失值的是
A.数值型变量呈正态分布且无极端异常值,缺失率低于5%
B.数值型变量呈严重右偏分布,且存在大量极端大额异常值
C.连续型变量样本量充足,缺失值为随机缺失
D.同用户分组下的连续型变量缺失,分组内数据分布均匀
答案:B
解析:均值对极端值非常敏感,严重右偏分布下的均值会被极端值拉高,无法代表数据的一般水平,此时采用中位数填充更合理。A、C、D场景下数据分布均匀无极端值,均值可以较好地代表整体水平,适合用均值填充。
您可能关注的文档
- 2026年企业人力资源管理师考试题库(附答案和详细解析)(0520).docx
- 2026年拍卖师资格证考试题库(附答案和详细解析)(0522).docx
- 2026年注册地籍测绘师考试题库(附答案和详细解析)(0505).docx
- RCEP原产地规则数字化.docx
- RCEP成员国数字贸易规则比较.docx
- 中医诊断学题目及答案.docx
- 中国哲学史题库及答案.docx
- 中文写作题库及答案.docx
- 中考模考语文试卷及解析.docx
- 中药学考试题及答案.docx
- 2025_2026学年高中历史第四单元中国社会主义建设发展道路的探索第21课经济腾飞与生活巨变学案含解析岳麓版必修2.doc
- 内蒙古农业大学《农业综合知识四》2025-2026年考研专业课真题试卷及答案.docx
- 事业单位笔试培训试卷问题解决能力专项训练试卷及答案.docx
- 2026届高考历史统考一轮复习模块3文化发展历程第13单元第30讲宗教改革和西方启蒙思想家的人文主义思想教师用书教案北师大版.doc
- 2026届高考历史统考一轮复习模块1政治文明历程第4单元第9讲近代欧美资产阶级的代议制教师用书教案北师大版.doc
- 四川省遂宁市射洪中学2025_2026学年高二数学下学期期末考试试题理.doc
- 2025_2026学年高中英语Unit1FestivalsaroundtheworldSectionⅢGrammar学案含解析新人教版必修3.doc
- 四川省内江市威远中学2026届高三物理下学期3月月考试题.doc
- 河北省张家口宣化一中2026届高三语文上学期11月月考试题.doc
- 河北省唐山市第一中学2025_2026学年高二英语上学期期中试题含解析1.doc
最近下载
- 最新完整版高中古诗文必背72篇(含注音、翻译) .docx VIP
- (高清版)DB11∕T 2036-2022 分布式光伏发电系统电气安全技术规范.pdf VIP
- (高清版)DB11∕T 1773-2022 分布式光伏发电工程技术规范.pdf VIP
- D-L 5190.3-2019 电力建设施工技术规范 第3部分:汽轮发电机组(高清可复制).pdf VIP
- 新解读《HG_T 2750 - 2022靛蓝》最新解读.docx VIP
- 行政工作报告(共6篇汇总).doc VIP
- 《低空飞行航线规划气象风险评估》标准立项修订与发展报告.docx VIP
- 输变电工程应用海拉瓦技术取费标准(2010年9月) .doc VIP
- 2026年广东中考语文真题试卷带答案.docx VIP
- 2025年西藏生物会考真题及答案.doc VIP
原创力文档

文档评论(0)