2026年数据分析师职业资格考试试题及答案.docxVIP

  • 4
  • 0
  • 约9.95千字
  • 约 35页
  • 2026-06-23 发布于四川
  • 举报

2026年数据分析师职业资格考试试题及答案.docx

2026年数据分析师职业资格考试试题及答案

一、单项选择题(每题2分,共30分)

1.某电商平台用户行为数据中,支付时间字段存在大量缺失值(缺失率35%),且该字段是分析用户支付时效性的关键指标。以下最合理的处理方式是:

A.直接删除缺失行

B.用订单创建时间替代

C.按用户历史支付时间均值填充

D.标记缺失值并单独建模

答案:D

解析:高缺失率且为关键指标时,直接删除(A)会损失大量样本;用订单时间替代(B)可能引入系统性偏差;用户历史均值(C)忽略了时间动态性;标记缺失值(D)可保留数据结构并通过模型捕捉缺失模式。

2.以下SQL语句执行后,返回的记录数是:

SELECTuser_idFROMuser_behavior

WHEREevent_type=click

GROUPBYuser_idHAVINGCOUNT()5;GROUPBYuser_idHAVINGCOUNT()5;

A.所有点击次数大于5的用户ID去重后的数量

B.所有点击事件中用户ID的总记录数

C.每个用户点击次数大于5的事件记录数

D.所有用户ID的唯一值数量

答案:A

解析:GROUPBYuser_id会按用户分组,HAVING筛选点击次数5的组,SELECTuser_id返回这些组的用

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档