2025年数据分析师职业认证考试试题及答案.docxVIP

2025年数据分析师职业认证考试试题及答案.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年数据分析师职业认证考试试题及答案

一、单项选择题(每题2分,共40分)

1.以下哪种数据类型同时具备顺序性和等距性,但无绝对零点?

A.定类数据

B.定序数据

C.定距数据

D.定比数据

答案:C

解析:定距数据(如温度)可以比较大小且间隔相等,但0不表示“无”;定比数据(如身高)有绝对零点。

2.某数据集的偏度系数为-1.2,说明数据分布呈现:

A.左偏(负偏),均值小于中位数

B.左偏(负偏),均值大于中位数

C.右偏(正偏),均值小于中位数

D.右偏(正偏),均值大于中位数

答案:A

解析:偏度为负时,数据左侧有长尾,均值受极端小值影响小于中位数。

3.以下哪项不是数据清洗中处理缺失值的常用方法?

A.直接删除含缺失值的记录

B.用变量均值填充

C.用K近邻算法预测填充

D.用相关变量的回归模型生成虚拟变量

答案:D

解析:生成虚拟变量(哑变量)用于分类变量编码,非缺失值处理方法。

4.在SQL中,要计算每个用户最近一次购买时间(字段为purchase_time),应使用:

A.MAX(purchase_time)OVER(PARTITIONBYuser_id)

B.MIN(purchase_time)OVER(PARTITIONBYuser_id)

C.ROW_NUMBER()OVER(PARTITIONBYuser_idORDERBYpurchase_timeDESC)

D.RANK()OVER(PARTITIONBYuser_idORDERBYpurchase_time)

答案:A

解析:MAX函数取每个用户分组的最大时间,即最近时间;窗口函数PARTITIONBY按用户分组。

5.用Python进行线性回归分析时,若发现自变量间存在严重多重共线性,最合理的处理方法是:

A.增加样本量

B.进行主成分分析(PCA)降维

C.对自变量取对数

D.剔除截距项

答案:B

解析:主成分分析可将高度相关的自变量转化为互不相关的主成分,降低共线性影响。

6.某电商平台用户行为数据中,“购买转化率”的计算公式是:

A.购买用户数/访问用户数

B.购买订单数/访问页面数

C.购买金额/访问时长

D.购买用户数/注册用户数

答案:A

解析:转化率核心是目标行为(购买)与初始行为(访问)的用户数比值。

7.以下哪种可视化图表最适合展示不同品类销售额随时间的趋势变化?

A.散点图

B.热力图

C.折线图

D.箱线图

答案:C

解析:折线图擅长展示连续时间序列的变化趋势。

8.在A/B测试中,若实验组的转化率为12%,对照组为10%,p值为0.02(α=0.05),结论是:

A.两组无显著差异

B.实验组转化率显著高于对照组

C.对照组转化率显著高于实验组

D.无法判断

答案:B

解析:p值<0.05,拒绝原假设(两组无差异),认为实验组有显著提升。

9.用Python的pandas处理数据时,若要将字符串列“日期”(格式为“2024-05-15”)转换为日期类型,应使用:

A.pd.to_datetime(df[日期])

B.df[日期].astype(datetime64)

C.pd.to_timedelta(df[日期])

D.df[日期].str.split(-)

答案:A

解析:pd.to_datetime是标准的字符串转日期函数。

10.以下哪项属于非监督学习任务?

A.预测用户是否会流失(二分类)

B.对用户评论进行情感分析(正/负)

C.将用户分成高、中、低价值群体(聚类)

D.预测产品销量(回归)

答案:C

解析:聚类无标签,属于非监督学习;分类、回归均为有监督。

11.某数据集的峰度系数为3.5,说明数据分布:

A.比正态分布更陡峭(尖峰)

B.比正态分布更平缓(平峰)

C.呈均匀分布

D.呈指数分布

答案:A

解析:正态分布峰度为3,大于3时数据更集中在均值附近,尾部更厚(尖峰)。

12.在SQL中,要查询2024年1月所有订单中,金额超过该月平均金额的记录,正确的子查询是:

A.SELECTFROMordersWHEREorder_dateBETWEEN2024-01-01AND2024-01-31ANDamoun

文档评论(0)

欣欣 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档