2025年数据分析师职业指导师(中级)专业能力试卷及答案.docxVIP

  • 0
  • 0
  • 约8.58千字
  • 约 24页
  • 2026-01-20 发布于四川
  • 举报

2025年数据分析师职业指导师(中级)专业能力试卷及答案.docx

2025年数据分析师职业指导师(中级)专业能力试卷及答案

一、单项选择题(每题1分,共30分。每题只有一个正确答案,请将正确选项的字母填在括号内)

1.在Python中,使用pandas读取CSV文件时,若文件编码为GBK,应使用的参数是()

A.encoding=utf8

B.encoding=gbk

C.decode=gbk

D.charset=gb2312

答案:B

2.某电商平台的用户行为日志中,字段“event_time”为字符串格式14:23:45”,若需将其转换为pandas的datetime类型,正确的代码是()

A.pd.to_datetime(df[event_time],format=%Y%m%d%H:%M:%S)

B.pd.to_datetime(df[event_time],unit=s)

C.pd.to_datetime(df[event_time],origin=unix)

D.pd.to_datetime(df[event_time],infer_datetime_format=False)

答案:A

3.在SQL中,计算用户次日留存率的正确逻辑是()

A.次日活跃用户数÷当日新增用户数

B.当日活跃用户数÷次日新增用户数

C.次日新增用户数÷当日活跃用户数

D.当日新增用户数÷次日活跃用户数

答案:A

4.使用Excel进行数据清洗时,若需将“2025/6/3”统一为,应优先使用的功能是()

A.查找与替换

B.分列

C.设置单元格格式→自定义

D.数据验证

答案:C

5.在Python中,使用seaborn绘制箱线图时,若需按“city”分组并显示“price”分布,正确的代码是()

A.sns.boxplot(x=city,y=price,data=df)

B.sns.boxplot(x=price,y=city,data=df)

C.sns.violinplot(x=city,y=price,kind=box)

D.sns.catplot(x=city,y=price,kind=box)

答案:A

6.某A/B实验样本量为10000,实验组转化率5.2%,对照组转化率4.8%,若使用两样本z检验,显著性水平α=0.05,临界值|z|=1.96,则结论为()

A.拒绝原假设,实验组显著优于对照组

B.拒绝原假设,对照组显著优于实验组

C.不拒绝原假设,差异不显著

D.无法判断,需补充样本量

答案:C

7.在PowerBI中,若需创建“同比”度量值,使用的DAX函数组合是()

A.CALCULATE+SAMEPERIODLASTYEAR

B.CALCULATE+DATEADD

C.CALCULATE+PARALLELPERIOD

D.CALCULATE+PREVIOUSYEAR

答案:A

8.使用Python进行文本分词时,若需精确模式并去除停用词,正确的jieba调用顺序是()

A.jieba.lcut(s,cut_all=False)→停用词过滤

B.jieba.lcut(s,cut_all=True)→停用词过滤

C.jieba.cut_for_search(s)→停用词过滤

D.jieba.tokenize(s)→停用词过滤

答案:A

9.在聚类分析中,若使用KMeans算法,且轮廓系数(silhouettescore)随k值增加而持续下降,则最佳k值应选()

A.轮廓系数最高点对应的k

B.轮廓系数最低点对应的k

C.手肘法则拐点对应的k

D.轮廓系数下降前的最大k

答案:A

10.在Python中,使用sklearn的StandardScaler进行特征标准化后,新特征的均值与方差分别为()

A.均值0,方差1

B.均值1,方差0

C.均值0,方差0

D.均值1,方差1

答案:A

11.在Tableau中,若需将“订单日期”字段快速生成“季度”维度,应使用的功能是()

A.创建→分层结构

B.右键→创建→计算字段

C.右键→离散→季度

D.右键→创建→组

答案:C

12.某平台使用RFM模型进行用户分层,其中“F”指()

A.最近一次消费间隔

B.消费频率

C.消费金额

D.消费品类数

答案:B

1

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档