- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第PAGE页共NUMPAGES页
2026年中信科数据分析师岗位面试题
一、统计学与数据分析基础(5题,每题6分,共30分)
1.题目:
某电商平台A/B测试了两种推荐算法对用户购买转化率的影响。算法X组(实验组)的转化率为5%,算法Y组(对照组)的转化率为4.5%。假设两组样本量均为10000,请计算这两种算法的转化率差异是否具有统计学显著性?(α=0.05)若具有显著性,请解释其商业意义。
2.题目:
某城市某季度外卖订单数据如下:订单金额均值为80元,中位数75元,标准差12元。该数据是否可能存在异常值?若存在,如何检测?请说明你的检测方法及原理。
3.题目:
某电信运营商收集了用户每月通话时长数据,发现数据呈右偏态分布。若需计算用户通话时长的代表性指标,应优先选择均值还是中位数?请解释原因。
4.题目:
某银行需评估两种营销策略对用户存款增长的影响。策略A的存款增长率均值为3%,标准差0.5%;策略B的存款增长率均值为2.8%,标准差0.3%。哪种策略更稳定?请用方差解释。
5.题目:
某零售商分析用户购买行为,发现年龄与购买频次的相关系数为0.6。请解释该系数的经济含义,并说明其局限性。
二、SQL与数据库查询(3题,每题10分,共30分)
1.题目:
某电商数据库包含三张表:`orders`(订单表,字段:order_id,user_id,order_date,amount)、`users`(用户表,字段:user_id,age,city)、`products`(商品表,字段:product_id,category)。请写出SQL查询语句,找出2025年11月上海地区20-30岁用户购买“电子产品”的总金额及订单数,按年龄降序排列。
2.题目:
某物流公司数据库包含`shipments`(运单表,字段:shipment_id,order_id,delivery_date,status)和`orders`(订单表,字段:order_id,ship_date)。请写出SQL语句,计算每个订单的“延迟天数”(实际配送日期预计配送日期),并筛选出延迟超过3天的订单,按延迟天数降序排列。
3.题目:
某银行数据库包含`loans`(贷款表,字段:loan_id,user_id,amount,approve_date)和`users`(用户表,字段:user_id,age,education)。请写出SQL查询,统计不同教育程度用户的贷款平均金额,并筛选出贷款金额最高的教育程度群体。
三、Python与数据处理(4题,每题7.5分,共30分)
1.题目:
某电商平台用户行为数据包含用户ID、浏览时长(分钟)、购买金额(元)。请用Python计算:
(1)浏览时长与购买金额的相关系数;
(2)若用户浏览时长超过10分钟,则标记为“高意向用户”,请统计高意向用户的平均购买金额。
2.题目:
某城市空气质量数据包含日期、PM2.5、PM10、温度。请用Python:
(1)绘制PM2.5与PM10的散点图;
(2)计算每日PM2.5的滚动均值(窗口大小为3天)。
3.题目:
某银行信用卡数据包含用户ID、消费金额、还款金额、逾期天数。请用Python:
(1)找出“高负债用户”(消费金额还款金额且逾期天数5);
(2)计算这些用户的平均逾期天数。
4.题目:
某电商平台用户评价数据包含评分(1-5)、评论内容。请用Python统计:
(1)各评分等级的数量占比;
(2)若评分≥4的评论中出现“推荐”字样,则标记为“正面推荐”,请统计正面推荐的占比。
四、机器学习与模型应用(3题,每题10分,共30分)
1.题目:
某电商平台需预测用户流失概率。已知特征包括:购买频率、最近一次购买时间、会员等级。请简述:
(1)若使用逻辑回归模型,如何解释其系数的经济意义?
(2)若使用决策树,如何避免过拟合?
2.题目:
某电信运营商需预测用户月话费消费额。已知特征包括:套餐类型、通话时长、流量使用量。请简述:
(1)若使用线性回归,如何检测特征多重共线性?
(2)若使用Lasso回归,如何选择最优正则化参数?
3.题目:
某银行需对贷款申请进行风险分类。已知特征包括:年龄、收入、信用历史。请简述:
(1)若使用随机森林,如何评估模型效果?
(2)若发现模型对“高收入用户”分类不准,如何优化?
五、业务理解与场景分析(3题,每题10分,共30分)
1.题目:
某电商平台A/B测试了两种定价策略:策略A(原价+满减),策略B(阶梯折扣)。数据显示策略B的销售额略高,但用户满意度低。请分析:
(1)如何平衡销售额与用户满意度?
(2)数据分析师应如何向管理层提出优化
您可能关注的文档
最近下载
- 办公设备维护方案.docx VIP
- 在带头固本培元、增强党性等“五个带头”方面对照检查发言材料2篇稿(2026年).docx VIP
- 股东合作协议书模板(通用17篇).doc VIP
- 2025年养老院护理员工作总结范文(通用5篇).docx VIP
- 浅析企业员工流失的原因及对策——以福州永辉超市为例.docx VIP
- XK3190-C8技术手册.pdf VIP
- 广州市历年中考(2025-2026)化学试题(含答案).doc VIP
- 浙江省杭州市学军中学四校区2022-2023学年高二上学期期末物理试题(含答案解析).docx
- 《金瓶梅》中潘金莲“绣鞋”之物象探析.doc VIP
- 14s501-1P35-37页球磨铸铁踏步施工检验标准.pdf VIP
原创力文档


文档评论(0)