2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0401).docxVIP

  • 2
  • 0
  • 约5.43千字
  • 约 8页
  • 2026-05-14 发布于江苏
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0401).docx

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

1.在数据科学中,什么是过拟合?

A.模型在训练数据上表现差,在测试数据上表现好

B.模型在训练数据上表现好,在测试数据上表现差

C.模型在训练和测试数据上都表现好

D.模型在训练和测试数据上都表现差

答案:B

解析:过拟合指模型过度学习训练数据的噪声和细节,导致在训练集上表现优异,但在新数据(测试集)上表现差。选项B正确描述了这一现象。选项A描述的是欠拟合,选项C和D不符合过拟合的定义。

以下哪个是数据预处理中的特征缩放方法?

A.删除缺失值

B.标准化(Z-score归一化)

C.添加新特征

D.数据可视化

答案:B

解析:特征缩放用于统一特征范围,标准化(Z-score)是常见方法,通过减去均值除以标准差实现。选项A是数据清洗步骤,选项C是特征工程,选项D是可视化阶段,不属于特征缩放。

在假设检验中,p值小于显著性水平(如0.05)表示什么?

A.接受原假设

B.拒绝原假设

C.无法得出结论

D.检验无效

答案:B

解析:p值表示在原假设成立下观察到当前数据或更极端数据的概率。p值0.05时,有足够证据拒绝原假设。选项A错误,因为p值小支持拒绝原假设;选项C和D不符合p值的定义。

以下哪个算法属于无监督学习?

A.线性回归

B.逻辑回归

C.K均值聚类

D.

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档