2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0423).docxVIP

  • 0
  • 0
  • 约1.88千字
  • 约 4页
  • 2026-06-06 发布于江苏
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0423).docx

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0423)

CDSP数据科学专业认证考试试卷

一、单项选择题(共10题,每题1分,共10分)

在数据预处理中,用于处理分类变量编码的方法是?

A.中位数填充

B.Z-score标准化

C.One-Hot编码

D.箱线图处理

答案:C

解析:

C正确:One-Hot编码将分类变量转换为二进制向量,是处理名义变量的标准方法。

A错误:中位数填充用于处理缺失值,非编码。

B错误:Z-score用于连续变量的标准化。

D错误:箱线图用于异常值检测。

K均值聚类算法的终止条件通常不包含?

A.聚类中心不再变化

B.样本分配不再变化

C.达到预设迭代次数

D.轮廓系数超过阈值

答案:D

解析:

D正确:轮廓系数是评估聚类质量的指标,非终止条件。

A、B、C错误:均为K均值的标准终止条件。

(其他单选题略…)

二、多项选择题(共10题,每题2分,共20分)

下列哪些属于监督学习任务?()

A.决策树分类

B.K-means聚类

C.线性回归

D.关联规则挖掘

答案:AC

解析:

A、C正确:分类和回归均需标签数据监督训练。

B错误:聚类是无监督学习。

D错误:关联规则属于无监督模式发现。

数据可视化中,适用于展示两个连续变量关系的图表包括?()

A.饼图

B.散点图

C.热力图

D.

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档