- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2025年商务数据分析职业资格考试试题及答案
一、单项选择题(每题2分,共30分)
1.某电商企业用户行为数据中,“用户ID”字段存在重复记录(同一用户ID对应多条完全相同的行为记录),最合理的处理方式是:
A.直接删除重复记录
B.对重复记录取均值
C.标记重复记录后保留
D.按时间戳保留最新记录
答案:A
解析:完全重复的记录不提供额外信息,直接删除可避免干扰分析结果;若为非完全重复(如部分字段差异),可能需保留最新或聚合处理,但本题明确“完全相同”,故选A。
2.某零售企业使用RFM模型分析客户价值,其中“M”(Monetary)指标的计算依据是:
A.最近一次购买时间
B.购买频率
C.累计消费金额
D.单次消费金额最大值
答案:C
解析:RFM模型中,M(Monetary)指客户在一定周期内的总消费金额,反映客户的价值贡献度;A为R(Recency),B为F(Frequency)。
3.在Python的Pandas库中,用于将两列字符串拼接的函数是:
A.`pd.concat()`
B.`str.cat()`
C.`merge()`
D.`applymap()`
答案:B
解析:`str.cat()`是Pandas中针对字符串列的拼接方法(如`df[列1].str.cat(df[列2],sep=-)`);`pd.concat()`用于合并DataFrame,`merge()`用于关联表,`applymap()`是逐元素应用函数。
4.某企业需分析“促销活动对销售额的影响”,若选择A/B测试,对照组应设置为:
A.未参与促销的随机用户组
B.参与促销但优惠力度更低的用户组
C.历史同期未促销的用户数据
D.高消费用户组
答案:A
解析:A/B测试要求对照组与实验组仅在测试变量(促销活动)上有差异,其他条件(如用户特征)需随机分配,故对照组应为未参与促销的随机用户组。
5.以下哪项不属于数据清洗的核心任务?
A.处理缺失值
B.转换数据格式(如日期格式统一)
C.计算衍生指标(如客单价=总销售额/订单量)
D.识别并修正异常值(如年龄字段出现150岁)
答案:C
解析:数据清洗是对原始数据的“修复”和“规范”,而衍生指标计算属于数据建模阶段的特征工程,故C不属于清洗任务。
6.某数据集的偏度(Skewness)为2.3,说明数据分布:
A.近似正态分布
B.左偏(负偏态)
C.右偏(正偏态)
D.均匀分布
答案:C
解析:偏度0时,数据右偏(长尾在右侧);偏度0时左偏;正态分布偏度接近0。本题偏度2.30,故为右偏。
7.某企业用K-means算法对客户分群,若手肘法(ElbowMethod)显示当k=4时,SSE(误差平方和)下降幅度显著变缓,k=5时SSE下降幅度极小,则最优分群数应为:
A.3
B.4
C.5
D.6
答案:B
解析:手肘法通过观察SSE随k增加的下降趋势,选择“拐点”(下降幅度显著变缓前的k值)作为最优分群数,本题k=4为拐点,故选B。
8.在SQL中,若需查询2024年各月份的销售额,且1月无销售记录时显示0,应使用:
A.`GROUPBY月份HAVING销售额0`
B.`LEFTJOIN`月份维度表与销售事实表
C.`WHERE年份=2024`
D.`SUM(销售额)OVER(PARTITIONBY月份)`
答案:B
解析:直接聚合销售表会过滤无销售的月份,需通过LEFTJOIN关联包含所有月份的维度表(如1-12月),确保无销售月份显示0。
9.某电商平台发现“用户注册时间”字段存在“2024-02-30”这样的异常值,最合理的处理方式是:
A.直接删除该记录
B.修正为“2024-02-29”(2024年为闰年)
C.标记为缺失值后填充(如用当月最后一天)
D.保留原始值,分析时忽略
答案:C
解析:2024年2月无30日,属于逻辑错误,直接删除可能损失其他字段信息;修正需确认业务场景(如用户可能误输入),更稳妥的方式是标记为缺失值并填充合理值(如当月最后一天29日)。
10.以下哪项指标最适合衡量用户对产品的长期粘性?
A.次日留存率
B.月活跃用户数(MAU)
C.30天复购率
D.生命周期价值(LTV)
答案:D
解析:LTV(生命周期价值)反映用户在整个生命周期内为企业带来的总收
您可能关注的文档
- 2025年山东省春季高考技能测试酒店管理类专业考试试题及答案.docx
- 2025年山东省春季高考技能考试汽车专业试题库(附答案).docx
- 2025年山东省春季高考技能考试医药类专业试题及答案.docx
- 2025年山东省春季高考汽车技能试题及答案.docx
- 2025年山东省大学生乡村医生专项计划招聘考试经典试题及答案.docx
- 2025年山东省档案管理及资料员试题及答案.docx
- 2025年山东省东营市暖通专业综合试题及答案.docx
- 2025年山东省东营市专业技术人员公需科目试题及答案.docx
- 2025年山东省度中考信息技术考试模拟题库及答案.docx
- 2025年山东省建筑施工特种作业架子工试题题库及答案.docx
- 初中英语人教版七年级上册第四单元Where is my schoolbag ! Section A .ppt
- 初中英语人教版七年级上册第四单元Where is my schoolbag Section B 2.ppt
- 初中英语人教版七年级下册 Unit 6 I'm watching TV. Section A 11a.pptx
- 注册土木工程师培训课件.ppt
- 初中生物济南版七年级上册第一章奇妙的生命现象 第三节生物学的探究方法.ppt
- 初中英语人教版七年级上册第四单元Where is my schoolbag Section B 2.pptx
- 注册安全工程师案例课件.ppt
- 初中物理人教版八年级上册第二章第4节噪声的危害和控制课件(共19张PPT).pptx
- 注册安全工程师王阳课件.ppt
- 初中数学青岛版八年级上2.4《线段的垂直平分线》课件(16张PPT).ppt
原创力文档


文档评论(0)