2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0305).docxVIP

  • 0
  • 0
  • 约7.96千字
  • 约 11页
  • 2026-03-22 发布于上海
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0305).docx

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

在数据清洗中,处理数值型特征的缺失值时,若数据分布存在明显异常值,最合理的填充方法是?

A.均值填充

B.中位数填充

C.众数填充

D.直接删除缺失行

答案:B

解析:均值易受异常值影响(A错误);众数适用于分类变量(C错误);直接删除可能导致数据量损失(D错误);中位数对异常值不敏感,适合分布偏态的数值型数据(B正确)。

以下哪项不是监督学习的典型任务?

A.预测房价(回归)

B.用户分群(聚类)

C.垃圾邮件分类(分类)

D.销量预测(时间序列)

答案:B

解析:监督学习需要标签数据,任务包括分类、回归、时间序列预测(A/C/D正确);聚类是无监督学习(B错误)。

在混淆矩阵中,“召回率(Recall)”的计算公式是?

A.TP/(TP+FP)

B.TP/(TP+FN)

C.TN/(TN+FP)

D.(TP+TN)/(TP+TN+FP+FN)

答案:B

解析:召回率衡量正样本被正确识别的比例,公式为TP/(TP+FN)(B正确);A是精确率,C是真负率,D是准确率(均错误)。

以下哪种数据可视化工具更适合实时动态数据展示?

A.Matplotlib

B.Tableau

C.Plotly

D.Seaborn

答案:C

解析:Plotly支持交互式动态图表(C正确)

文档评论(0)

1亿VIP精品文档

相关文档