商务数据分析模拟题库及答案.docxVIP

商务数据分析模拟题库及答案.docx

本文档由用户AI专业辅助创建,并经网站质量审核通过
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

商务数据分析模拟题库及答案

一、单项选择题(每题2分,共20分)

1.某电商平台用户订单数据中,“支付时间”字段存在“2023-02-2915:30:00”这样的记录,该问题属于数据清洗中的()。

A.重复值问题B.异常值问题C.格式不一致问题D.逻辑错误问题

答案:D(解析:2023年2月没有29天,属于日期逻辑错误,非格式或数值异常。)

2.某零售企业分析2023年各季度销售额时,发现Q3销售额为1200万元,Q4为1500万元,计算环比增长率为()。

A.20%B.25%C.30%D.33.3%

答案:B(解析:环比增长率=(本期-上期)/上期×100%=(1500-1200)/1200=25%。)

3.以下哪种数据可视化图表最适合展示“某品牌手机2018-2023年各月销量趋势”?()

A.柱状图B.折线图C.散点图D.热力图

答案:B(解析:折线图擅长展示时间序列的趋势变化。)

4.在用户分群分析中,RFM模型的“M”指的是()。

A.最近购买时间B.购买频率C.购买金额D.客户生命周期价值

答案:C(解析:RFM模型中,R=Recency(最近购买时间),F=Frequency(购买频率),M=Monetary(购买金额)。)

5.某银行信用卡部门通过逻辑回归模型预测用户逾期风险,模型输出的AUC值为0.85,说明()。

A.模型预测准确率为85%B.模型区分正负样本的能力较强

C.模型存在严重过拟合D.模型适用于分类问题但不适用于回归问题

答案:B(解析:AUC(曲线下面积)衡量模型对正负样本的区分能力,0.85属于“良好”区间(0.8-0.9)。)

6.某电商平台发现用户浏览商品页到加入购物车的转化率为3%,行业平均水平为5%,可能的原因不包括()。

A.商品页加载速度慢B.商品价格标注不清晰

C.购物车页面设计复杂D.商品详情页信息不完整

答案:C(解析:购物车页面设计影响的是“加入购物车到支付”的转化率,而非“浏览到加购”的转化率。)

7.在进行假设检验时,若原假设为“某促销活动对销售额无显著影响”,当实际活动有效但检验结果未拒绝原假设,此时发生了()。

A.第一类错误(α错误)B.第二类错误(β错误)

C.正确决策D.数据偏差错误

答案:B(解析:第二类错误指原假设为假时未拒绝原假设,即“漏判”。)

8.某企业用Python进行数据清洗,代码“df.drop_duplicates(subset=[user_id,order_date],keep=first)”的作用是()。

A.删除所有重复行B.按用户ID和订单日期删除重复行,保留第一条

C.按用户ID和订单日期删除重复行,保留最后一条D.仅删除完全重复的行

答案:B(解析:subset指定去重依据的列,keep=first表示保留首次出现的重复行。)

9.以下哪个指标不属于用户留存分析的核心指标?()

A.次日留存率B.7日留存率C.客单价D.30日留存率

答案:C(解析:客单价属于用户价值指标,留存率关注用户活跃持续性。)

10.某奶茶店分析不同口味奶茶的销售占比,最适合的可视化工具是()。

A.雷达图B.饼图C.箱线图D.直方图

答案:B(解析:饼图直观展示各部分占总体的比例。)

二、简答题(每题8分,共40分)

1.简述数据清洗的主要步骤及常见问题。

答案:

数据清洗是确保数据质量的关键过程,主要步骤包括:

(1)识别问题:通过统计、可视化等方法检测缺失值、异常值、重复值、逻辑错误等;

(2)处理缺失值:根据业务场景选择删除(缺失率>70%)、填充(均值/中位数/众数填充、插值法、模型预测填充);

(3)处理异常值:通过Z-score、IQR(四分位距)等方法识别后,选择修正(如用上下限替换)、删除或保留(若为真实业务场景);

(4)处理重复值:删除完全重复或关键列重复的冗余数据;

(5)修正格式错误:统一日期、数值、文本的格式(如“2023/1/1”改为“2023-01-01”);

(6)验证逻辑一致性:检查跨字段的合理性(如“出生日期”早于“注册时间”)。

常见问题包括:缺失值分布不均(如关键字段大量缺失)、异常值由业务特殊事件导致(如大促期间的高订单量)、重复值因系统日志重复写入产生、格式错误由多数据源合并导致。

2.说明A/B测试的核心原理及实施步骤。

答案:

A/B

文档评论(0)

ღ᭄ꦿ若西এ⁵²º᭄ + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档