2026年高级数据分析师考试题库(附答案和详细解析)(0312).docxVIP

  • 0
  • 0
  • 约6.85千字
  • 约 10页
  • 2026-05-01 发布于上海
  • 举报

2026年高级数据分析师考试题库(附答案和详细解析)(0312).docx

高级数据分析师考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪种方法最适合处理高维非线性关系数据中的缺失值?

A.均值填充法

B.随机森林填充法

C.直接删除缺失行

D.时间序列插值法

答案:B

解析:随机森林填充法通过其他特征预测缺失值,适用于高维非线性关系数据(正确);均值填充法假设数据分布均匀,可能引入偏差(错误);直接删除缺失行会丢失有效信息(错误);时间序列插值法仅适用于时序数据(错误)。

在A/B测试中,原假设(H?)通常表述为?

A.实验组效果显著优于对照组

B.两组用户转化率无显著差异

C.实验组的方差大于对照组

D.样本量满足统计显著性要求

答案:B

解析:原假设是“无差异”的统计假设,用于验证是否存在显著差异(正确);A是备择假设(错误);C涉及方差比较,非原假设核心(错误);D是实验设计要求,非假设内容(错误)。

以下哪项是机器学习模型过拟合的典型表现?

A.训练集准确率85%,测试集准确率83%

B.训练集准确率95%,测试集准确率60%

C.训练集和测试集准确率均为70%

D.训练集准确率70%,测试集准确率75%

答案:B

解析:过拟合表现为训练集效果远好于测试集(正确);A是正常泛化(错误);C是欠拟合(错误);D可能是数据划分问题(错误)。

计算用户生命周期价值(LTV)时,核心指标不包括?

A.平均订单价值

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档