2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0414).docxVIP

  • 1
  • 0
  • 约1.79千字
  • 约 4页
  • 2026-05-15 发布于江苏
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0414).docx

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0414)

数据科学专业认证(CDSP)模拟试卷

一、单项选择题(共10题,每题1分,共10分)

1.在监督学习中,以下哪种方法用于处理分类问题?

A.线性回归

B.K-Means聚类

C.决策树

D.主成分分析(PCA)

答案:C

解析:

-决策树通过特征分割构建分类规则(如基尼系数/信息增益),直接解决分类问题。

-A:线性回归处理连续值预测;B:K-Means是无监督聚类;D:PCA是降维方法。

贝叶斯定理的核心是:

A.计算条件概率P(A|B)=P(B|A)P

贝叶斯定理公式是P(A

B:是朴素贝叶斯的假设;C:是线性回归目标;D:是频率学派的参数估计方法。

(篇幅限制,此处展示2题,实际需10题)

二、多项选择题(共10题,每题2分,共20分)

1.以下哪些属于特征工程方法?()

A.对数值型变量进行Z-score标准化

B.使用TF-IDF处理文本特征

C.通过箱线图检测离群值

D.用KNN算法填充缺失值

答案:ABCD

解析:

-A:标准化消除量纲影响;B:TF-IDF是文本向量化技术;C:离群值处理提升模型鲁棒性;D:缺失值填充是特征预处理关键步骤。

关于交叉验证,正确的有()

A.K-FoldCV将数据集分为K份,轮流以1份作测试集

B.留一法(LOOCV

文档评论(0)

1亿VIP精品文档

相关文档