2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0226).docxVIP

  • 0
  • 0
  • 约8.87千字
  • 约 11页
  • 2026-03-24 发布于贵州
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0226).docx

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪项是数据清洗中处理缺失值的合理方法?

A.对所有缺失值直接删除整行数据

B.对分类变量缺失值用均值填充

C.当特征缺失比例低于5%时,可直接删除对应行

D.对连续变量缺失值用众数填充

答案:C

解析:A错误,直接删除整行可能导致数据大量丢失,仅适用于缺失比例极低的场景;B错误,分类变量缺失值应使用众数填充(均值适用于连续变量);C正确,缺失比例低于5%时删除对应行是常见策略;D错误,连续变量缺失值通常用均值或中位数填充(众数适用于分类变量)。

监督学习与无监督学习的核心区别是?

A.是否需要特征工程

B.是否有标签数据

C.是否使用迭代优化

D.是否处理结构化数据

答案:B

解析:监督学习需要带标签的训练数据(如分类问题中的类别标签),无监督学习仅使用无标签数据(如聚类)。其他选项均非核心区别:A(特征工程是通用步骤)、C(部分无监督学习也需迭代)、D(两者均可处理结构化数据)。

在混淆矩阵中,F1-score的计算基于以下哪两个指标?

A.准确率(Accuracy)和召回率(Recall)

B.精确率(Precision)和特异度(Specificity)

C.精确率(Precision)和召回率(Recall)

D.准确率(Accuracy)和精确率(Precis

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档