- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据分析面试题及答案
一、基础认知题(考察对数据分析的核心理解)
问:数据清洗在整个分析流程中占比很高,你认为清洗时最需要关注哪3个点?为什么?
答:首先是缺失值处理,不能直接删,要先查缺失原因——比如用户注册时“职业”字段非必填导致的缺失,和系统故障导致的“订单金额”缺失,处理逻辑完全不同(前者可标“未知”,后者需补采或用同用户同品类订单均值替代);其次是异常值识别,要结合业务定义异常,比如电商“客单价10万”,不能只看数值偏离,还要看是否是企业客户采购,避免误删有效数据;最后是数据一致性,比如“用户ID”在订单表是“12345”,在用户表是“012345”,这种格式差异会导致关联失败,必须统一规则。
问:你怎么区分“PV”和“UV”?实际业务中,什么时候更关注PV,什么时候更关注UV?
答:PV是页面浏览量(同一用户刷新10次算10个PV),UV是独立访客数(同一用户一天内多次访问只算1个UV)。关注PV通常是看内容/活动的吸引力,比如公众号推文PV高,说明内容传播性好;电商活动页PV高,说明引流效果好。关注UV更多是看用户覆盖度,比如新APP上线后,日UV增长快,说明拉新策略有效;会员体系改版后,UV下降,可能是会员权益没吸引力导致用户流失。
二、工具操作题(考察SQL/Excel等核心工具实操)
SQL题:现有订单表(order_id,user_id,product_id,pay_amount,pay_time)和商品表(product_id,category,price),请写SQL查“2024年每个商品品类的总销售额、订单数,以及客单价(总销售额/订单数)”,要求只显示客单价大于50的品类。
答:
SELECT
p.categoryAS商品品类,
SUM(o.pay_amount)AS总销售额,
COUNT(DISTINCTo.order_id)AS订单数,--避免同一订单多次统计
ROUND(SUM(o.pay_amount)/COUNT(DISTINCTo.order_id),2)AS客单价
FROM
ordero
LEFTJOIN
productpONo.product_id=p.product_id
WHERE
DATE_FORMAT(o.pay_time,%Y)=2024--按年份筛选
ANDo.pay_amount0--排除退款/0金额订单
GROUPBY
p.category
HAVING
客单价50;--筛选客单价条件
注:实际写的时候会先确认pay_time的字段类型(是datetime还是date),如果是timestamp可能要调整格式函数;另外会用COUNT(DISTINCTorder_id)而非COUNT(order_id),因为可能存在订单表重复数据的情况。
Excel题:用Excel怎么快速匹配“用户表”和“消费表”中的用户信息?如果匹配时出现“#N/A”,可能是什么原因?
答:常用VLOOKUP函数,比如要在“消费表”中匹配“用户表”的“用户等级”,公式可以是=VLOOKUP(消费表!A2,用户表!$A:$C,3,0)——其中“消费表!A2”是要匹配的用户ID,“用户表!A:C”是匹配范围(用户ID在A列,等级在C列),“3”是取用户表第3列的等级,“0”是精确匹配。
出现“#N/A”可能是:①两边用户ID格式不一致(比如一边是文本“123”,一边是数字123);②消费表中的用户ID在用户表中不存在(比如新用户还没同步到用户表);③匹配范围的列号写错(比如实际等级在第4列,却写了3)。
三、业务分析题(考察业务落地能力)
问:某电商平台发现“618”后一周的用户复购率下降了15%,你会怎么分析原因?
答:先按“数据确认→维度拆解→归因验证→提出建议”的逻辑来:
第一步,确认数据准确性——先查复购率的计算口径(是“下单用户数/前7天下单用户数”还是“付款用户数/前30天下单用户数”),再核对是否有数据统计错误(比如订单状态同步延迟、退款数据没剔除);
第二步,多维度拆解复购率下降——①按用户分层:新用户/老用户/会员,看是哪类用户下降明显(比如老用户复购降20%,新用户降5%,说明问题在老用户);②按商品品类:看是美妆、家电还是食品类复购降,比如家电类降30%,可能是
文档评论(0)