2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0310).docxVIP

  • 1
  • 0
  • 约6.93千字
  • 约 10页
  • 2026-04-17 发布于江苏
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0310).docx

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪项不属于数据清洗的核心任务?

A.处理缺失值

B.去除重复记录

C.计算特征重要性

D.修正异常值

答案:C

解析:数据清洗的核心任务包括处理缺失值(A)、去除重复记录(B)、修正异常值(D)等,旨在提高数据质量。计算特征重要性(C)属于特征工程或模型训练阶段的任务,因此选C。

在监督学习中,“过拟合”现象的主要原因是?

A.模型复杂度不足

B.训练数据量过大

C.模型对训练数据噪声过度学习

D.测试数据分布与训练数据不一致

答案:C

解析:过拟合是模型在训练数据上表现很好,但在新数据上泛化能力差,主要原因是模型过度学习了训练数据中的噪声和细节(C)。模型复杂度不足会导致欠拟合(A错误),训练数据量过大通常缓解过拟合(B错误),测试数据分布不一致属于数据偏移问题(D错误)。

以下哪种统计量用于衡量数据分布的对称性?

A.方差

B.偏度

C.峰度

D.均值

答案:B

解析:偏度(Skewness)衡量数据分布的不对称程度(B正确);方差衡量数据离散程度(A错误),峰度衡量分布的尖峰或平尾程度(C错误),均值是集中趋势指标(D错误)。

若混淆矩阵中TP=80,FP=20,FN=10,TN=90,则精确率(Precision)为?

A.80/(80+10)=0.89

B.

文档评论(0)

1亿VIP精品文档

相关文档