2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0520).docxVIP

  • 5
  • 0
  • 约5.94千字
  • 约 8页
  • 2026-06-12 发布于上海
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0520).docx

数据科学专业认证(CDSP)

一、单项选择题(共10题,每题1分,共10分)

在机器学习中,当模型在训练集上表现很好,但在测试集或新数据上表现很差时,这种现象被称为:A.过拟合B.欠拟合C.泛化D.偏差

答案:A解析:过拟合是指模型学习了训练数据中的噪声和细节,导致对未见数据的预测能力下降。选项B欠拟合是指模型过于简单,无法捕捉数据的潜在规律;选项C泛化是衡量模型能力的指标;选项D偏差是模型预测值与真实值之间的误差。

以下哪个Python库主要用于数据可视化和交互式图表的生成?A.PandasB.NumPyC.MatplotlibD.Scikit-learn

答案:C解析:Matplotlib是Python中最基础的绘图库,广泛用于创建静态、交互式和动画式图表。选项APandas主要用于数据操作和分析;选项BNumPy是数值计算基础库;选项DScikit-learn是机器学习工具库。

在统计学中,衡量一组数据离散程度的指标不包括以下哪项?A.方差B.标准差C.极差D.平均数

答案:D解析:平均数(均值)是衡量数据集中趋势的指标,不反映数据的离散程度。方差、标准差和极差(最大值与最小值之差)都是衡量离散程度的指标。

决策树算法中,用于划分节点的标准通常不包括以下哪项?A.信息增益C.基尼不纯度D.均方误差

答案:

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档