2026年数据分析师面试题集与实战经验.docxVIP

  • 0
  • 0
  • 约4.09千字
  • 约 12页
  • 2026-02-05 发布于福建
  • 举报

2026年数据分析师面试题集与实战经验.docx

第PAGE页共NUMPAGES页

2026年数据分析师面试题集与实战经验

一、统计学基础(3题,每题10分,共30分)

1.答案:在一个数据集中,如果变量X和Y的协方差为正,说明X和Y之间存在正相关关系;协方差为负,说明存在负相关关系;协方差接近零,则可能不存在线性相关关系。协方差的大小与变量的单位有关,通常不便于直接比较,因此常用相关系数(CorrelationCoefficient)来衡量线性相关程度,其取值范围为[-1,1]。

解析:协方差衡量两个变量的联合变动趋势,但受数据尺度影响。例如,销售额(万元)和销售量(件)的协方差可能很大,但相关系数可能接近零(因单位差异)。相关系数消除了尺度影响,更直观反映线性关系强度。

2.答案:假设某电商平台的订单金额服从正态分布,均值为100元,标准差为20元。根据68-95-99.7法则,约68%的订单金额在80元到120元之间;约95%在60元到140元之间;约99.7%在40元到160元之间。若某订单金额为200元,其Z分数为(200-100)/20=5,远超3个标准差,属于小概率事件,可能需要核查数据准确性。

解析:正态分布是数据分析中的基础模型,常用于预测和异常检测。Z分数用于标准化,便于比较不同分布的数据。小概率事件通常需要进一步验证,如是否存在录入错误或特殊业务场景。

3.答案:假设某城市A和B的房价数据如下:

-A:均值为5000元/平米,标准差500元

-B:均值为8000元/平米,标准差800元

若用变异系数(CoefficientofVariation,CV)衡量波动性,A的CV=500/5000=0.1,B的CV=800/8000=0.1,说明两地房价波动性相同,尽管绝对差异很大。

解析:变异系数是无量纲指标,适用于比较不同单位或均值的离散程度。在金融和房地产分析中常用,避免因均值差异导致误解。

二、SQL查询(4题,每题10分,共40分)

4.答案:

sql

SELECT

c.customer_id,

c.name,

COUNT(o.order_id)ASorder_count,

SUM(o.total_amount)AStotal_spent

FROM

customersc

LEFTJOINordersoONc.customer_id=o.customer_id

GROUPBY

c.customer_id,c.name

HAVING

total_spent(SELECTAVG(total_amount)FROMorders)

ORDERBY

total_spentDESC;

解析:

-LEFTJOIN确保即使客户未下单也能显示,用NULL填充订单字段。

-GROUPBY按客户分组,统计订单数和消费总额。

-HAVING筛选消费总额高于平均值的客户。

-子查询计算整体平均消费,用于条件过滤。

5.答案:

sql

SELECT

p.product_id,

p.name,

COUNT(DISTINCTd.device_id)ASunique_device_count

FROM

productsp

JOINordersoONp.product_id=o.product_id

JOINdevicesdONo.device_id=d.device_id

GROUPBY

p.product_id,p.name

ORDERBY

unique_device_countDESC,p.nameASC;

解析:

-JOIN连接产品、订单和设备表,确保数据一致性。

-COUNT(DISTINCT)统计每个产品的独立设备数量,避免重复计数。

-ORDERBY先按设备数降序,再按产品名称升序排序。

6.答案:

sql

SELECT

m.month,

COUNT(DISTINCTp.product_id)ASnew_products,

AVG(s.score)ASavg_score

FROM

monthly_salesm

JOINproductspONm.product_id=p.product_id

JOINscoressONp.product_id=s.product_id

WHERE

m.year=2025

GROUPBY

m.month

ORDERBY

m.month;

解析:

-JOIN连接月度销售、产品和评分表。

-COUNT(DISTINCT)统计每月新增产品数。

-AVG计算平均评分,用于评估产品受欢迎程度。

-WHERE限定年份为2025,聚焦当前业务。

7.答

文档评论(0)

1亿VIP精品文档

相关文档