2026年数据分析师SQL与机器学习面试题及答案.docxVIP

2026年数据分析师SQL与机器学习面试题及答案.docx

本文档由用户AI专业辅助创建,并经网站质量审核通过
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第PAGE页共NUMPAGES页

2026年数据分析师SQL与机器学习面试题及答案

一、SQL查询题(共5题,每题8分,总分40分)

1.题目:假设有一个电商平台的订单表`orders`,包含字段`order_id`(订单ID)、`customer_id`(客户ID)、`order_date`(订单日期)、`total_amount`(订单金额)。请写SQL查询,找出2025年每个客户的总消费金额,并按总消费金额降序排列,如果总消费金额相同,则按客户ID升序排列。

答案:

sql

SELECTcustomer_id,SUM(total_amount)AStotal_spent

FROMorders

WHEREorder_dateBETWEEN2025-01-01AND2025-12-31

GROUPBYcustomer_id

ORDERBYtotal_spentDESC,customer_idASC;

解析:首先,通过`WHERE`子句筛选出2025年的订单数据。然后,使用`SUM(total_amount)`计算每个客户的总消费金额,并使用`GROUPBY`按客户ID分组。最后,使用`ORDERBY`对结果进行降序排列,如果总消费金额相同,则按客户ID升序排列。

2.题目:假设有一个用户表`users`,包含字段`user_id`(用户ID)、`registration_date`(注册日期)、`last_login_date`(最后登录日期)。请写SQL查询,找出所有在2025年注册且至少登录过一次的用户,并按注册日期降序排列。

答案:

sql

SELECTuser_id

FROMusers

WHEREregistration_dateBETWEEN2025-01-01AND2025-12-31

ANDuser_idIN(SELECTuser_idFROMusersWHERElast_login_dateISNOTNULL);

解析:首先,通过`WHERE`子句筛选出2025年注册的用户。然后,使用子查询找出所有最后登录日期不为空的用户。最后,使用`IN`操作符将这两个条件结合起来,并按注册日期降序排列。

3.题目:假设有一个产品表`products`,包含字段`product_id`(产品ID)、`category_id`(分类ID)、`price`(价格)。请写SQL查询,找出每个分类的平均产品价格,并只显示平均价格大于100的产品分类。

答案:

sql

SELECTcategory_id,AVG(price)ASaverage_price

FROMproducts

GROUPBYcategory_id

HAVINGAVG(price)100;

解析:首先,使用`GROUPBY`按分类ID分组。然后,使用`AVG(price)`计算每个分类的平均产品价格。最后,使用`HAVING`子句筛选出平均价格大于100的分类。

4.题目:假设有一个订单明细表`order_items`,包含字段`order_id`(订单ID)、`product_id`(产品ID)、`quantity`(数量)。请写SQL查询,找出每个订单中数量最多的产品,并显示订单ID、产品ID和数量。

答案:

sql

WITHRankedItemsAS(

SELECTorder_id,product_id,quantity,

RANK()OVER(PARTITIONBYorder_idORDERBYquantityDESC)ASrank

FROMorder_items

)

SELECTorder_id,product_id,quantity

FROMRankedItems

WHERErank=1;

解析:首先,使用`WITH`子句创建一个临时表`RankedItems`,其中包含每个订单的产品数量和排名。然后,使用`RANK()`窗口函数按订单ID分组,并按数量降序排列。最后,筛选出每个订单中数量最多的产品。

5.题目:假设有一个用户表`users`,包含字段`user_id`(用户ID)、`age`(年龄)、`gender`(性别)。请写SQL查询,找出年龄在20到30岁之间的女性用户数量。

答案:

sql

SELECTCOUNT()ASfemale_users_count

FROMusers

WHEREageBETWEEN20AND30ANDgender=Female;

解析:通过`WHERE`子句筛选出年龄在20到30岁之间且性别为女性的用户,并使用`COUNT(

您可能关注的文档

文档评论(0)

ll17770603473 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档