2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0430).docxVIP

  • 0
  • 0
  • 约2.07千字
  • 约 4页
  • 2026-05-09 发布于上海
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0430).docx

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0430)

CDSP数据科学专业认证考试试卷

一、单项选择题(共10题,每题1分,共10分)

在监督学习中,用于评估分类模型性能的指标是:

A.均方根误差(RMSE)

B.轮廓系数(SilhouetteScore)

C.F1分数(F1-Score)

D.霍普金斯统计量(HopkinsStatistic)

答案:C

解析:

F1-Score是精确率与召回率的调和平均,专门用于分类模型评估。

A用于回归任务;B和D属于聚类评估指标。

关于数据清洗中的缺失值处理,下列方法错误的是:

A.对连续变量使用中位数填充

B.对分类变量直接删除整行

C.用随机森林预测缺失值

D.对时间序列数据使用前向填充

答案:B

解析:

直接删除整行可能导致严重样本偏差;A适合偏态分布数据;C属于高级插补方法;D符合时间序列特性。

(限于篇幅展示2题,实际需完成10题)

二、多项选择题(共10题,每题2分,共20分)

下列属于特征工程范畴的操作包括:

A.对年龄字段进行分箱处理

B.用主成分分析(PCA)降维

C.计算特征间的皮尔逊相关系数

D.调整SVM的惩罚系数C

答案:ABC

解析:

A是特征变换,B是维度约减,C是特征分析,均属于特征工程。D属于模型超参数调优,不属于特征工程。

在聚类分析中,DBSCAN算法

文档评论(0)

1亿VIP精品文档

相关文档