数据分析笔试题目及参考答案.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据分析笔试题目及参考答案

一、单项选择题(共10题,每题3分,共30分)

以下哪种情况最适合使用中位数来描述数据的集中趋势?()

A.某公司员工的月工资分布(存在少数高薪管理层)

B.班级学生的数学平均分

C.超市每日销售额的平均值

D.产品合格率的统计

在Excel中,要计算一组数据的标准差(样本标准差),应使用的函数是()

A.STDEV.PB.STDEV.SC.VAR.PD.AVERAGE

以下关于数据清洗的描述,错误的是()

A.数据清洗需要处理缺失值、异常值和重复值

B.直接删除所有缺失值是最稳妥的处理方式

C.异常值可能是真实数据,也可能是录入错误

D.重复值可能导致分析结果偏高

某电商平台统计用户购买转化率,公式应为()

A.下单用户数/浏览用户数×100%

B.付款用户数/下单用户数×100%

C.浏览用户数/注册用户数×100%

D.加入购物车用户数/浏览用户数×100%

以下哪种图表最适合展示不同类别数据的占比关系?()

A.折线图B.柱状图C.饼图D.散点图

假设某数据集呈正态分布,其均值为50,标准差为10,那么数据落在40-60之间的概率约为()

A.68%B.95%C.99.7%D.50%

在SQL中,要从“订单表”中查询2023年1月的所有订单,且按订单金额降序排列,正确的语句是()

A.SELECT*FROM订单表WHERE订单日期LIKE2023-01%ORDERBY订单金额ASC

B.SELECT*FROM订单表WHERE订单日期BETWEEN2023-01-01AND2023-01-31ORDERBY订单金额DESC

C.SELECT*FROM订单表WHERE订单日期=2023-01ORDERBY订单金额DESC

D.SELECT*FROM订单表WHERE订单日期IN2023-01ORDERBY订单金额ASC

以下关于相关系数r的说法,正确的是()

A.r的取值范围是[0,1]

B.r=0表示两个变量完全无关

C.r=1表示两个变量完全正相关

D.r=-0.8比r=0.5的相关性更弱

某品牌连续12个月的销售额数据,要分析其长期变化趋势,应使用()

A.饼图B.直方图C.折线图D.雷达图

数据抽样时,为了保证样本的代表性,最常用的抽样方法是()

A.随机抽样B.方便抽样C.主观抽样D.配额抽样

二、多项选择题(共5题,每题4分,共20分,多选、少选、错选均不得分)

以下属于描述性统计分析的有()

A.计算数据的平均值、中位数、标准差

B.绘制数据的频率分布直方图

C.用回归分析预测未来销售额

D.计算两个变量的相关系数

处理数据缺失值的常用方法包括()

A.删除缺失值所在的行或列

B.用均值、中位数或众数填充

C.用相邻数据插值填充

D.忽略缺失值继续分析

SQL中常用的聚合函数有()

A.SUM()B.COUNT()C.MAX()D.CONCAT()

以下哪些属于数据质量的评估指标?()

A.准确性B.完整性C.一致性D.时效性

进行A/B测试时,需要注意的事项有()

A.测试组和对照组的用户特征应保持一致

B.测试期间应避免其他变量干扰

C.样本量越大,测试结果越可靠

D.测试时间越长越好

三、计算题(共2题,每题10分,共20分)

某超市30天的日销售额数据如下(单位:万元):

25,28,32,29,35,30,27,26,31,33,

24,29,34,30,28,29,32,31,27,30,

33,26,28,30,31,29,32,25,34,27

请计算该组数据的均值、中位数和标准差(保留两位小数)。

某电商平台有A、B两个商品,已知:

A商品的点击量为1000次,下单量为50单;

B商品的点击量为800次,下单量为48单。

请计算两个商品的点击率(注:此处点击率指下单转化率),并比较哪个商品的转化效果更好。

四、实操题(共1题,15分)

现有一张“用户购买记录表”,表结构如下:

字段名

字段类型

说明

user_id

字符串

用户唯一标识

order_id

字符串

订单唯一标识

purchase_da

文档评论(0)

151****9429 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档