2025年数据科学与大数据分析考试试卷及答案.docx

2025年数据科学与大数据分析考试试卷及答案.docx

2025年数据科学与大数据分析考试试卷及答案

一、单项选择题(每题2分,共20分)

1.以下哪种场景最可能导致数据倾斜(DataSkew)?

A.对均匀分布的用户ID进行分组统计

B.对长尾分布的商品ID进行JOIN操作

C.对时间戳字段进行范围过滤

D.对数值型特征进行标准化处理

答案:B

2.特征选择中,卡方检验(Chi-squareTest)主要用于评估:

A.连续特征与连续目标的相关性

B.类别特征与类别目标的相关性

C.连续特征与类别目标的相关性

D.类别特征与连续目标的相关性

答案:B

3.若某分类模型在训练集

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档