数据分析师面试全攻略及问题集.docxVIP

  • 0
  • 0
  • 约6.08千字
  • 约 14页
  • 2026-02-26 发布于福建
  • 举报

第PAGE页共NUMPAGES页

2026年数据分析师面试全攻略及问题集

一、基础知识(10题,共40分)

1.(单选题,5分)数据分析师的核心职责是什么?

A.编写复杂的SQL查询

B.设计数据可视化报表

C.提出业务洞察并推动决策

D.负责数据仓库的日常运维

答案:C

解析:数据分析师的核心价值在于通过数据分析为业务提供决策支持,而不仅仅是执行技术任务。选项A和B是分析师的日常工作内容,但不是核心职责;选项D更偏向数据工程师的职责。

2.(多选题,5分)以下哪些属于描述性分析的应用场景?

A.用户流失原因分析

B.销售趋势月度报告

C.产品功能使用频率统计

D.竞品市场份额对比

答案:B、C、D

解析:描述性分析主要用于总结历史数据,展示现状。选项A属于诊断性分析;选项B、C、D通过统计报表、频率统计、对比分析等方式呈现数据规律。

3.(判断题,5分)相比Excel,Python在处理超大规模数据时具有天然优势。

答案:正确

解析:Python的Pandas、Dask等库在分布式计算和内存管理上优于Excel,适合TB级数据处理。

4.(简答题,10分)解释数据清洗的三个主要步骤及其目的。

答案:

1.缺失值处理:通过删除或填充(均值/中位数/众数/模型预测)解决缺失数据问题,避免分析偏差。

2.异常值检测:使用箱线图、Z-score等方法识别离群点,判断是否为错误数据或真实极端情况,需谨慎处理。

3.数据格式统一:如日期格式转换、文本标准化(去除空格/特殊字符),确保数据一致性,避免计算错误。

5.(填空题,10分)在进行A/B测试时,影响结论可靠性的关键假设包括______、______和______。

答案:零假设、统计显著性水平、样本量

解析:零假设是检验的前提;显著性水平(如0.05)决定拒绝原假设的阈值;样本量过小会导致结果不可靠。

二、SQL(5题,共30分)

6.(单选题,6分)以下哪个SQL语句能正确计算每个用户的平均订单金额(忽略订单为0的情况)?

A.`SELECTuser_id,AVG(order_amount)FROMordersGROUPBYuser_id`

B.`SELECTuser_id,AVG(CASEWHENorder_amount0THENorder_amountEND)FROMordersGROUPBYuser_id`

C.`SELECTuser_id,AVG(order_amount)FROMordersWHEREorder_amount0GROUPBYuser_id`

D.`SELECTuser_id,SUM(order_amount)/COUNT()FROMordersGROUPBYuser_id`

答案:B

解析:选项B使用`CASEWHEN`过滤掉0值,其他选项要么未过滤,要么语法错误(如D的除法运算)。

7.(多选题,6分)以下哪些SQL函数属于窗口函数?

A.`SUM()`

B.`ROW_NUMBER()`

C.`COUNT()`

D.`LAG()`

答案:B、D

解析:聚合函数(A、C)作用于分组数据,窗口函数(B、D)通过`OVER()`子句分析数据序列。

8.(简答题,8分)写出SQL语句,查找最近30天内订单金额最高的3个用户及其订单金额。

答案:

sql

SELECTuser_id,order_amount

FROMorders

WHEREorder_date=DATE_SUB(CURDATE(),INTERVAL30DAY)

ORDERBYorder_amountDESC

LIMIT3;

解析:使用`DATE_SUB`计算日期范围,按金额降序排列并限制结果为前3名。

9.(复杂查询题,10分)假设有两张表:

-`orders`(order_id,user_id,amount,order_date)

-`users`(user_id,name,city)

写出SQL语句,按城市分组统计每个城市最近一年的订单总金额,仅显示金额超过10000的城市。

答案:

sql

SELECTu.city,SUM(o.amount)AStotal_amount

FROMorderso

JOINusersuONo.user_id=u.user_id

WHEREo.order_date=DATE_SUB(CURDATE(),INTERVAL1YEAR)

GROUPBYu.city

HAVINGSUM(o.amount)10000;

文档评论(0)

1亿VIP精品文档

相关文档