2026年高级数据分析师考试题库(附答案和详细解析)(0126).docxVIP

  • 0
  • 0
  • 约7.99千字
  • 约 11页
  • 2026-03-17 发布于上海
  • 举报

2026年高级数据分析师考试题库(附答案和详细解析)(0126).docx

高级数据分析师考试试卷(总分100分)

一、单项选择题(共10题,每题1分,共10分)

以下哪种方法最适合处理类别型特征的编码问题?

A.标准化(Z-score)

B.独热编码(One-HotEncoding)

C.分箱(Binning)

D.对数变换(LogTransformation)

答案:B

解析:类别型特征(如“性别”“职业”)需要转换为数值形式以便模型处理。独热编码通过创建二进制列(每列对应一个类别)解决类别间无序的问题,是类别型特征的标准处理方法。错误选项:A用于数值型特征的归一化;C用于连续变量离散化;D用于处理数值型数据的偏态分布。

以下哪项是过拟合(Overfitting)的典型表现?

A.训练集和测试集准确率都很低

B.训练集准确率高,测试集准确率低

C.训练集准确率低,测试集准确率高

D.训练集和测试集准确率接近但偏低

答案:B

解析:过拟合指模型在训练数据上过度学习细节(包括噪声),导致泛化能力差。此时训练集准确率高(模型记住了训练数据),但测试集准确率低(无法适应新数据)。错误选项:A是欠拟合;C不符合实际规律;D是模型复杂度不足的表现。

在分类模型评估中,“召回率(Recall)”的计算公式是?

A.真阳性/(真阳性+假阳性)

B.真阳性/(真阳性+假阴性)

C.真阴性/(真阴性+假阳性)

D.真阴性/(真阴性+假阴性)

文档评论(0)

1亿VIP精品文档

相关文档