2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0116).docxVIP

  • 0
  • 0
  • 约8.84千字
  • 约 12页
  • 2026-03-07 发布于上海
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0116).docx

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

数据科学项目的核心流程中,“特征工程”通常出现在哪个阶段?

A.数据收集

B.数据清洗

C.模型构建前的预处理

D.模型评估后优化

答案:C

解析:特征工程是将原始数据转换为模型可理解的特征的过程,属于模型构建前的关键预处理步骤。A为数据获取阶段,B是处理数据质量问题,D是模型优化阶段,均不涉及特征工程的核心任务。

以下哪种方法最适合处理时间序列数据的缺失值?

A.直接删除缺失行

B.用全局均值填充

C.前向填充(ffill)

D.随机森林预测填充

答案:C

解析:时间序列数据具有时序依赖性,前向填充(ffill)利用相邻时间点的数值填充缺失值,能保留时序特征。A会丢失时间连续性,B忽略时序性,D计算成本高且可能引入噪声。

在混淆矩阵中,“假阳性(FalsePositive)”指的是?

A.实际为正类,模型预测为正类

B.实际为负类,模型预测为正类

C.实际为正类,模型预测为负类

D.实际为负类,模型预测为负类

答案:B

解析:混淆矩阵的行是真实标签,列是预测标签。假阳性即真实为负(行负)、预测为正(列正)的情况,对应B选项。A是真阳性(TP),C是假阴性(FN),D是真阴性(TN)。

以下哪种算法属于无监督学习?

A.逻辑回归

B.K-means聚类

C.随机森林

文档评论(0)

1亿VIP精品文档

相关文档