2025年高级数据分析师考试题库(附答案和详细解析)(1113).docx

2025年高级数据分析师考试题库(附答案和详细解析)(1113).docx

  1. 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
  2. 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  3. 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

高级数据分析师考试试卷

一、单项选择题(共10题,每题1分,共10分)

在特征工程中,处理高基数类别特征(如用户ID)最有效的方法是?

A.直接进行独热编码(One-HotEncoding)

B.使用目标编码(TargetEncoding)

C.保留原始字符串作为特征

D.随机删除部分类别

答案:B

解析:高基数类别特征(如用户ID)的独热编码会导致维度爆炸(选项A错误);保留原始字符串无法被模型直接处理(选项C错误);随机删除类别会丢失关键信息(选项D错误)。目标编码通过类别与目标变量的统计关系(如均值)进行编码,既能保留信息又避免维度问题(选项B正确)。

时间序列预测中,若数据

文档评论(0)

杜家小钰 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档