2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0402).docxVIP

  • 0
  • 0
  • 约1.6千字
  • 约 3页
  • 2026-05-14 发布于上海
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0402).docx

数据科学专业认证(CDSP)模拟试卷

考试时间:120分钟

满分:100分

一、单项选择题(共10题,每题1分,共10分)

下列关于过拟合的描述正确的是:

A.训练误差高,测试误差高

B.训练误差低,测试误差高

C.训练误差高,测试误差低

D.训练误差低,测试误差低

答案:B

解析:过拟合指模型在训练集表现好(训练误差低)但泛化能力差(测试误差高)。A是欠拟合,C/D不符合过拟合特征。

主成分分析(PCA)主要用于:

A.分类样本类别

B.降低特征维度

C.处理缺失值

D.优化聚类中心

答案:B

解析:PCA通过正交变换将相关特征转换为线性无关的主成分,核心目标是降维。A/C/D分别涉及分类、数据预处理和聚类算法。

二、多项选择题(共10题,每题2分,共20分)

关于交叉验证的正确描述有:

A.k折交叉验证需将数据集随机分为k等份

B.留一法(LOOCV)是k折验证的特例(k=样本数)

C.验证集用于模型超参数调优

D.测试集应参与模型训练过程

答案:ABC

解析:A是k折基本规则;B中LOOCV的k等于样本量;C是验证集核心作用;D错误,测试集必须独立于训练过程以评估泛化能力。

以下属于集成学习算法的有:

A.决策树

B.随机森林

C.AdaBoost

D.K-means

答案:BC

解析:B(随机森林)和C(AdaBoost)通过组合多个弱学习器

文档评论(0)

1亿VIP精品文档

相关文档