2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0429).docxVIP

  • 1
  • 0
  • 约5.68千字
  • 约 9页
  • 2026-05-18 发布于江苏
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0429).docx

一、单项选择题(共10题,每题1分,共10分)

在数据预处理中,以下哪种方法用于处理缺失值?

A.特征缩放

B.独热编码

C.均值填充

D.主成分分析

答案:C

解析:均值填充是处理缺失值的常用方法,通过计算特征的均值来填充缺失值,避免数据偏差。选项A(特征缩放)用于归一化数据范围,选项B(独热编码)用于处理分类变量,选项D(主成分分析)用于降维,均不直接处理缺失值。

在机器学习中,以下哪个算法属于监督学习?

A.K-means聚类

B.决策树

C.主成分分析

D.Apriori算法

答案:B

解析:决策树是一种监督学习算法,用于分类或回归任务,需要标签数据训练。选项A(K-means聚类)和选项D(Apriori算法)属于无监督学习,选项C(主成分分析)是降维技术而非学习算法。

在假设检验中,p值小于显著性水平(α)时,我们应如何决策?

A.接受原假设

B.拒绝原假设

C.增加样本量

D.重新计算p值

答案:B

解析:p值小于α时,表示有足够证据拒绝原假设,支持备择假设。选项A错误,因为接受原假设仅在p值大于α时发生;选项C和D是后续步骤,而非直接决策。

以下哪种图表最适合展示两个连续变量之间的关系?

A.饼图

B.条形图

C.散点图

D.箱线图

答案:C

解析:散点图能直观显示两个连续变量的相关性和分布模式。选项A(饼图)用于比例数据,选项B(条

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档