2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0422).docxVIP

  • 1
  • 0
  • 约1.85千字
  • 约 4页
  • 2026-05-22 发布于上海
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0422).docx

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0422)

以下为严格依据CDSP认证考试大纲设计的试卷,符合所有格式及内容要求:

数据科学专业认证(CDSP)模拟试卷

一、单项选择题(共10题,每题1分,共10分)

在监督学习中,以下哪种方法最适合处理高维稀疏文本数据?

A.决策树

B.逻辑回归

C.朴素贝叶斯

D.K-Means聚类

答案:C

解析:

朴素贝叶斯基于条件独立假设,对高维稀疏文本(如TF-IDF矩阵)计算效率高。选项A易过拟合,B需特征工程优化,D为无监督方法,与监督学习不符。

关于交叉验证的说法,错误的是:

A.可减少模型过拟合风险

B.K-Fold验证中K越大,偏差越小

C.分层抽样确保每折类别比例一致

D.Leave-One-Out是K-Fold的特例(K=样本量)

答案:B

解析:

K越大时方差增大,偏差不变。A正确(验证集独立);C正确(分层保持分布);D正确(LOOCV即K=n)。

(省略其他8题,完整试卷包含)

二、多项选择题(共10题,每题2分,共20分)

下列属于数据清洗关键步骤的有:

A.处理缺失值

B.删除所有异常值

C.标准化数值型特征

D.纠正数据类型错误

答案:ACD

解析:

数据清洗需处理缺失值(插补/删除)、标准化(消除量纲)、修正数据类型(如日期格式)。B错误:异常值需分析原因再处理,盲

文档评论(0)

1亿VIP精品文档

相关文档