数据科学题目及分析.docxVIP

数据科学题目及分析.docx

数据科学题目及分析

一、单项选择题（共10题，每题1分，共10分）

数据科学项目标准流程的首个环节是以下哪一项？

A.数据清洗

B.数据采集

C.模型训练

D.结果可视化

答案：B

解析：数据科学项目的流程需从获取原始数据开始，因此首个环节是数据采集。选项A数据清洗属于数据预处理环节，是采集完成后的步骤；选项C模型训练是建模阶段的核心操作，需在预处理完成后开展；选项D结果可视化是项目输出环节的工作，处于流程末端。

以下哪种缺失值处理方法不属于插值类方法？

A.均值填充

B.中位数填充

C.删除含缺失值的行

D.K近邻填充

答案：C

解析：插值类方法的核心是通过规则补全缺失值，而删除含缺失值的行是直接舍弃不完整样本，没有补全操作，不属于插值方法。其余三个选项均是通过不同规则生成合理值填充缺失位置，属于插值类方法。

以下哪种算法属于监督学习范畴？

A.K均值聚类

B.决策树分类

C.主成分分析

D.关联规则挖掘

答案：B

解析：监督学习的核心是需要带标注的目标变量用于训练，决策树分类需要标注好的分类标签训练模型，属于监督学习。其余三个选项均属于无监督学习，训练过程不需要标注的目标变量。

二分类场景中，实际为正样本的样本被模型预测为负样本的情况对应的指标是？

A.精确率

B.召回率

C.假阳率

D.假阴率

答案：D

解析：假阴率的定义就是真实为正、预测为负

更多 >