2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0505).docxVIP

  • 1
  • 0
  • 约1.51千字
  • 约 3页
  • 2026-06-02 发布于江苏
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0505).docx

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0505)

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

在假设检验中,p值的定义是:

A.原假设为真的概率

B.备择假设为假的概率

C.观测到当前样本或更极端样本的概率(原假设为真时)

D.样本均值等于总体均值的概率

答案:C

解析:p值是在原假设成立的前提下,出现当前样本统计量或更极端值的概率。选项A混淆了p值与假设概率,选项B/D不符合统计定义。

关于过拟合现象,描述正确的是:

A.模型在训练集和测试集上均表现优异

B.模型复杂度低于数据真实结构

C.模型过度捕捉训练集噪声导致泛化能力下降

D.增加训练数据会加剧过拟合

答案:C

解析:过拟合指模型过度拟合训练数据细节(包括噪声),导致在新数据上性能下降。选项A描述欠拟合,选项B/D与事实相反。

二、多项选择题(共10题,每题2分,共20分)

下列属于特征工程方法的有:

A.对年龄变量进行分箱处理

B.使用主成分分析(PCA)降维

C.删除包含缺失值的所有样本

D.对分类变量进行独热编码

答案:ABD

解析:特征工程包括特征变换(A/D)和降维(B)。C是样本处理而非特征处理,且可能造成信息损失。

关于交叉验证的正确说法:

A.k折交叉验证中k值越大,偏差越小

B.留一法(LOOCV)是

文档评论(0)

1亿VIP精品文档

相关文档