2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0413).docxVIP

  • 1
  • 0
  • 约5.41千字
  • 约 8页
  • 2026-05-06 发布于上海
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0413).docx

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

在回归分析中,用于描述预测值与实际值之间误差平方的平均值的统计量是什么?

A.方差

B.残差平方和

C.决定系数(R-squared)

D.平均绝对误差

答案:D

解析:平均绝对误差(MAE)是衡量预测值与实际值之间绝对差异的统计量,适用于回归模型中误差的评估。A选项方差描述数据离散程度,并非针对预测误差。B选项残差平方和是总误差平方值,未标准化。C选项R-squared度量模型解释方差的比例,不是误差量本身。

在数据科学中,哪个数据处理方法用于处理类别变量,使其便于机器学习模型输入?

A.标准化

B.归一化

C.One-Hot编码

D.主成分分析(PCA)

答案:C

解析:One-Hot编码将类别变量转化为二值特征,避免模型误解顺序关系。A选项标准化用于数值变量缩放到相同尺度。B选项归一化类似于标准化,但针对不同需求。D选项PCA用于降维,不直接处理类别编码。

下列关于监督学习和非监督学习的描述中,哪项是正确的?

A.监督学习需要标签数据,而聚类是监督学习的一种

B.分类问题是典型的非监督学习任务

C.非监督学习不需要标签数据,常见于异常检测

D.降维通常属于监督学习

答案:C

解析:非监督学习如聚类或异常检测,不需要标签数据用于训练。A选项错误,因为聚类是非监督学习。B

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档