尚硅谷数据分析师认证考试题库及答案.docxVIP

尚硅谷数据分析师认证考试题库及答案.docx

本文档由用户AI专业辅助创建,并经网站质量审核通过
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第PAGE页共NUMPAGES页

尚硅谷数据分析师认证考试题库及答案

一、单选题(每题2分,共20题)

1.在数据清洗过程中,以下哪项不属于常见的异常值处理方法?

A.箱线图法

B.Z-score法

C.IQR(四分位距)法

D.均值替换法

2.假设某电商平台的用户购买行为数据中,订单金额的分布呈现右偏态,那么计算中心趋势应优先选择哪个指标?

A.均值

B.中位数

C.众数

D.标准差

3.以下哪个指标最适合衡量数据集的离散程度?

A.方差

B.偏度

C.峰度

D.熵值

4.在SQL查询中,以下哪个函数用于计算分组后的非空平均值?

A.SUM()

B.AVG()

C.COUNT()

D.MAX()

5.假设某城市房价数据中,房屋面积和价格的线性关系越强,那么其相关系数(Pearson)的取值范围是多少?

A.[0,1]

B.[-1,1]

C.[0,10]

D.无穷大

6.在数据可视化中,以下哪种图表最适合展示不同类别数据的占比?

A.折线图

B.散点图

C.饼图

D.热力图

7.假设某公司员工的离职率与工作年限呈负相关,那么以下哪个结论是正确的?

A.工作年限越长,离职率越高

B.工作年限越长,离职率越低

C.工作年限与离职率无关

D.无法确定相关性

8.在Excel中,以下哪个函数用于计算一组数据的最大值?

A.MIN()

B.MAX()

C.MEDIAN()

D.STDEV()

9.假设某电商平台需要分析用户的复购率,以下哪个指标最适合衡量用户忠诚度?

A.ARPU(每用户平均收入)

B.LTV(用户终身价值)

C.CVR(转化率)

D.AOV(客单价)

10.在时间序列分析中,以下哪种方法适用于处理具有明显趋势和季节性的数据?

A.ARIMA模型

B.线性回归

C.逻辑回归

D.决策树

二、多选题(每题3分,共10题)

1.在数据预处理阶段,以下哪些属于常见的缺失值处理方法?

A.删除缺失值

B.均值/中位数/众数填充

C.KNN填充

D.插值法

2.假设某公司需要分析用户的消费行为,以下哪些指标属于业务指标?

A.CVR(转化率)

B.ARPU(每用户平均收入)

C.GMV(商品交易总额)

D.调整后的R2

3.在SQL查询中,以下哪些函数属于聚合函数?

A.SUM()

B.AVG()

C.COUNT()

D.GROUPBY

4.假设某电商平台需要分析用户的购买偏好,以下哪些图表适合展示?

A.柱状图

B.散点图

C.雷达图

D.热力图

5.在机器学习模型评估中,以下哪些指标适用于分类问题?

A.准确率(Accuracy)

B.精确率(Precision)

C.召回率(Recall)

D.F1分数

6.假设某城市需要分析交通拥堵情况,以下哪些因素可能影响交通流量?

A.时间(高峰/平峰)

B.天气状况

C.节假日

D.车流量

7.在数据清洗中,以下哪些属于异常值检测方法?

A.箱线图法

B.Z-score法

C.DBSCAN聚类

D.均值绝对偏差(MAD)

8.假设某公司需要分析用户流失原因,以下哪些分析方法可能适用?

A.用户画像分析

B.留存率分析

C.离职用户调研

D.A/B测试

9.在Excel中,以下哪些函数用于统计计算?

A.SUMIF()

B.VLOOKUP()

C.COUNTIFS()

D.CONCATENATE()

10.在时间序列预测中,以下哪些模型可能适用?

A.ARIMA模型

B.Prophet模型

C.线性回归

D.LSTM神经网络

三、判断题(每题1分,共10题)

1.假设某城市房价数据中,房屋面积和价格的散点图呈线性关系,那么其相关系数一定为1。

(√/×)

2.在SQL查询中,GROUPBY子句必须与聚合函数一起使用。

(√/×)

3.假设某电商平台需要分析用户的复购率,复购率越高说明用户忠诚度越低。

(√/×)

4.在数据可视化中,折线图最适合展示不同类别数据的占比。

(√/×)

5.假设某公司需要分析用户的消费行为,ARPU(每用户平均收入)越高说明用户价值越高。

(√/×)

6.在机器学习模型中,调整后的R2值越高,模型拟合效果越好。

(√/×)

7.假设某城市需要分析交通拥堵情况,天气状况对交通流量没有影响。

(√/×)

8.在Excel中,COUNTA函数用于计算非空单元格的数量。

(√/×)

9.假设某电商平台需要分析用户的购买偏好,饼图最适合展示不同商品类别的占比。

(√/×)

10.在时间序列分析中,ARIMA模型适用于处理具有明显

您可能关注的文档

文档评论(0)

158****1500 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档