2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0306).docxVIP

  • 1
  • 0
  • 约7.45千字
  • 约 11页
  • 2026-04-23 发布于上海
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0306).docx

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪项是数据清洗中处理缺失值的合理方法?

A.对所有含缺失值的行直接删除

B.对分类变量缺失值填充均值

C.对小比例缺失的特征直接删除该特征

D.对时间序列数据缺失值使用KNN插值法

答案:C

解析:A错误,直接删除所有含缺失值的行可能导致数据大量丢失;B错误,分类变量应填充众数而非均值;C正确,当特征缺失比例较小时(如5%),删除该特征是合理选择;D错误,KNN插值法适用于非时间序列的多元数据,时间序列更常用前向/后向填充或时序模型插值。

以下哪项不属于监督学习任务?

A.预测用户是否会购买商品(二分类)

B.识别图像中的猫和狗(多分类)

C.对客户群体进行聚类(无标签)

D.预测房价(回归)

答案:C

解析:监督学习需要标签数据,C是无监督学习(聚类),其余选项均有明确标签(购买与否、类别、房价数值)。

在混淆矩阵中,“假阳性(FalsePositive)”指的是?

A.实际为正类,模型预测为正类

B.实际为负类,模型预测为正类

C.实际为正类,模型预测为负类

D.实际为负类,模型预测为负类

答案:B

解析:假阳性(FP)是“误将负类判为正类”,对应B;A是TP(真阳性),C是FN(假阴性),D是TN(真阴性)。

以下哪种可视化图表最适合展示不同类别数据的占比?

A

文档评论(0)

1亿VIP精品文档

相关文档