2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0506).docxVIP

  • 1
  • 0
  • 约6.62千字
  • 约 9页
  • 2026-05-19 发布于江苏
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0506).docx

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

在数据科学中,过拟合(Overfitting)是指什么?

A.模型在训练数据上表现好但在未见数据上表现差。

B.模型对训练数据和测试数据都表现良好。

C.模型在训练数据上表现差但在测试数据上表现好。

D.模型对所有数据的泛化能力都强。

答案:A

解析:过拟合是机器学习常见问题,指模型过度学习训练数据的噪声和细节,导致在训练集上准确率高,但在新数据上效果下降(如验证集或测试集)。选项B描述理想情况但不是过拟合;C描述欠拟合(Underfitting);D与模型泛化能力相关,但过拟合时泛化能力差。

在Python中,Pandas库主要用于什么?

A.实现高级机器学习算法。

B.处理时间序列数据和分析结构化数据。

C.进行数据可视化和绘图。

D.操作大数据集上的并行计算。

答案:B

解析:Pandas是数据科学核心库,专注于数据操作(如DataFrames),用于数据清洗、预处理和时间序列分析。选项A错误,因机器学习库如Scikit-learn更适用;C是Matplotlib或Seaborn的范畴;D针对大数据工具如PySpark。

什么是特征缩放(FeatureScaling)?

A.从数据中删除低相关性的特征。

B.将特征值归一化到相同量级(如0到1)。

C.选择数据中的关键

文档评论(0)

1亿VIP精品文档

相关文档