2025年商务数据分析职业资格考试试题及答案.docxVIP

2025年商务数据分析职业资格考试试题及答案.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年商务数据分析职业资格考试试题及答案

一、单项选择题(每题2分,共30分)

1.某电商企业用户行为数据中,“用户ID”字段存在重复记录(同一用户ID对应多条完全相同的行为记录),最合理的处理方式是:

A.直接删除重复记录

B.对重复记录取均值

C.标记重复记录后保留

D.按时间戳保留最新记录

答案:A

解析:完全重复的记录不提供额外信息,直接删除可避免干扰分析结果;若为非完全重复(如部分字段差异),可能需保留最新或聚合处理,但本题明确“完全相同”,故选A。

2.某零售企业使用RFM模型分析客户价值,其中“M”(Monetary)指标的计算依据是:

A.最近一次购买时间

B.购买频率

C.累计消费金额

D.单次消费金额最大值

答案:C

解析:RFM模型中,M(Monetary)指客户在一定周期内的总消费金额,反映客户的价值贡献度;A为R(Recency),B为F(Frequency)。

3.在Python的Pandas库中,用于将两列字符串拼接的函数是:

A.`pd.concat()`

B.`str.cat()`

C.`merge()`

D.`applymap()`

答案:B

解析:`str.cat()`是Pandas中针对字符串列的拼接方法(如`df[列1].str.cat(df[列2],sep=-)`);`pd.concat()`用于合并DataFrame,`merge()`用于关联表,`applymap()`是逐元素应用函数。

4.某企业需分析“促销活动对销售额的影响”,若选择A/B测试,对照组应设置为:

A.未参与促销的随机用户组

B.参与促销但优惠力度更低的用户组

C.历史同期未促销的用户数据

D.高消费用户组

答案:A

解析:A/B测试要求对照组与实验组仅在测试变量(促销活动)上有差异,其他条件(如用户特征)需随机分配,故对照组应为未参与促销的随机用户组。

5.以下哪项不属于数据清洗的核心任务?

A.处理缺失值

B.转换数据格式(如日期格式统一)

C.计算衍生指标(如客单价=总销售额/订单量)

D.识别并修正异常值(如年龄字段出现150岁)

答案:C

解析:数据清洗是对原始数据的“修复”和“规范”,而衍生指标计算属于数据建模阶段的特征工程,故C不属于清洗任务。

6.某数据集的偏度(Skewness)为2.3,说明数据分布:

A.近似正态分布

B.左偏(负偏态)

C.右偏(正偏态)

D.均匀分布

答案:C

解析:偏度0时,数据右偏(长尾在右侧);偏度0时左偏;正态分布偏度接近0。本题偏度2.30,故为右偏。

7.某企业用K-means算法对客户分群,若手肘法(ElbowMethod)显示当k=4时,SSE(误差平方和)下降幅度显著变缓,k=5时SSE下降幅度极小,则最优分群数应为:

A.3

B.4

C.5

D.6

答案:B

解析:手肘法通过观察SSE随k增加的下降趋势,选择“拐点”(下降幅度显著变缓前的k值)作为最优分群数,本题k=4为拐点,故选B。

8.在SQL中,若需查询2024年各月份的销售额,且1月无销售记录时显示0,应使用:

A.`GROUPBY月份HAVING销售额0`

B.`LEFTJOIN`月份维度表与销售事实表

C.`WHERE年份=2024`

D.`SUM(销售额)OVER(PARTITIONBY月份)`

答案:B

解析:直接聚合销售表会过滤无销售的月份,需通过LEFTJOIN关联包含所有月份的维度表(如1-12月),确保无销售月份显示0。

9.某电商平台发现“用户注册时间”字段存在“2024-02-30”这样的异常值,最合理的处理方式是:

A.直接删除该记录

B.修正为“2024-02-29”(2024年为闰年)

C.标记为缺失值后填充(如用当月最后一天)

D.保留原始值,分析时忽略

答案:C

解析:2024年2月无30日,属于逻辑错误,直接删除可能损失其他字段信息;修正需确认业务场景(如用户可能误输入),更稳妥的方式是标记为缺失值并填充合理值(如当月最后一天29日)。

10.以下哪项指标最适合衡量用户对产品的长期粘性?

A.次日留存率

B.月活跃用户数(MAU)

C.30天复购率

D.生命周期价值(LTV)

答案:D

解析:LTV(生命周期价值)反映用户在整个生命周期内为企业带来的总收

您可能关注的文档

文档评论(0)

小小何 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档