2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0303).docxVIP

  • 0
  • 0
  • 约7.4千字
  • 约 11页
  • 2026-03-24 发布于江苏
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0303).docx

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

在分类任务中,若模型对正类的识别能力很强但容易误判负类,混淆矩阵中最可能出现的情况是?

A.真阳性(TP)高,假阳性(FP)高

B.真阳性(TP)高,假阴性(FN)高

C.真阴性(TN)高,假阳性(FP)高

D.真阴性(TN)高,假阴性(FN)高

答案:A

解析:正类识别能力强意味着TP(正确识别的正类)高;容易误判负类(将负类错误识别为正类)对应FP(假阳性)高。B选项FN(假阴性,漏判正类)高与“识别能力强”矛盾;C、D的TN(正确识别的负类)高不符合“误判负类”的描述。

以下哪种特征选择方法基于模型预测结果的重要性?

A.卡方检验

B.互信息法

C.随机森林特征重要性

D.方差阈值法

答案:C

解析:随机森林通过计算特征在树分裂中对信息增益(如基尼指数)的贡献度评估重要性,属于模型依赖的特征选择方法。A(卡方检验)和B(互信息法)是统计检验方法;D(方差阈值)基于特征自身离散程度。

为解决过拟合问题,以下措施中最不相关的是?

A.增加训练数据量

B.降低模型复杂度(如减少决策树深度)

C.引入L2正则化

D.提高学习率

答案:D

解析:过拟合是模型对训练数据过度学习,泛化能力差。增加数据量(A)、降低复杂度(B)、正则化(C)均可缓解过拟合。提高学习率(D)影响优化速

文档评论(0)

1亿VIP精品文档

相关文档