数据分析基础水平测试题及答案.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据分析基础水平测试题及答案

一、单项选择题(每题3分,共30分)

下列统计量中,不受极端值影响的是()

A.算术平均数B.中位数C.极差D.方差

某电商平台统计1000名用户的日消费金额,想反映数据的分布形态,最适合使用的图表是()

A.折线图B.饼图C.直方图D.散点图

已知一组数据的标准差为2,则其方差为()

A.1B.2C.4D.8

在回归分析中,R2(决定系数)的取值范围是()

A.[0,1]B.[-1,1]C.[0,+∞)D.(-∞,+∞)

抽样调查中,为了保证样本的代表性,最合适的抽样方法是()

A.方便抽样B.分层抽样C.自愿抽样D.判断抽样

某产品的合格率为95%,现随机抽取20件产品,其中合格产品数服从()

A.正态分布B.二项分布C.泊松分布D.均匀分布

下列关于相关系数r的说法,错误的是()

A.r=0表示变量间无线性相关关系B.|r|越接近1,线性相关程度越强

C.r=1表示完全正相关D.r为负数时,变量间无相关关系

描述数据离散程度的指标不包括()

A.四分位距B.众数C.标准差D.变异系数

对两组数据进行均值比较,当样本量较小时且总体方差未知时,应使用()

A.Z检验B.t检验C.χ2检验D.F检验

数据清洗过程中,处理缺失值的常用方法不包括()

A.删除法B.替换法C.预测法D.保留法

二、填空题(每题4分,共20分)

描述数据集中趋势的三大核心指标是:平均数、__________和众数。

概率的基本性质中,互斥事件A和B的并事件概率P(A∪B)=__________。

箱线图通过__________、上四分位数、下四分位数、最大值和最小值五个关键数据点展示数据分布。

简单线性回归方程的表达式为?=a+bx,其中b称为__________。

数据预处理的主要步骤包括:数据清洗、数据集成、数据变换和__________。

三、计算题(每题15分,共30分)

某班级10名学生的数学考试成绩分别为:85、78、92、88、90、75、82、86、95、80。

要求:(1)计算该组数据的算术平均数和中位数;(2)计算该组数据的标准差(保留两位小数)。

某超市销售两种品牌的饮料,A品牌的月销售量服从均值为500箱、标准差为50箱的正态分布,B品牌的月销售量服从均值为300箱、标准差为40箱的正态分布。

要求:(1)计算A品牌月销售量超过550箱的概率;(2)计算B品牌月销售量在260-340箱之间的概率(已知正态分布中,P(-1≤Z≤1)=0.6826,P(Z1)=0.1587)。

四、案例分析题(20分)

某手机厂商收集了100款手机的售价(单位:元)和续航时间(单位:小时)数据,进行相关性分析和回归分析,得到以下结果:

相关系数r=0.85;

回归方程:?=10+0.01x。

请回答以下问题:

解释相关系数r=0.85的含义;

解释回归方程中系数0.01的经济意义;

若某款手机的售价为3000元,预测其续航时间;

结合分析结果,说明手机售价和续航时间的关系对厂商定价和产品设计的启示。

参考答案

一、单项选择题

B2.C3.C4.A5.B6.B7.D8.B9.B10.D

二、填空题

中位数2.P(A)+P(B)3.中位数4.回归系数(或斜率)5.数据规约

三、计算题

(1)算术平均数:

\bar{x}=\frac{85+78+92+88+90+75+82+86+95+80}{10}=85.1

将数据排序:75、78、80、82、85、86、88、90、92、95,中位数为第5、6项的平均值:

\text{??-?????°}=\frac{85+86}{2}=85.5

(2)标准差:

s=\sqrt{\frac{\sum_{i=1}^{10}(x_i-\bar{x})^2}{n-1}}=\sqrt{\frac{408.9}{9}}\approx6.74

(1)A品牌:Z=(550-500)/50=1,P(Z1)=0.1587,故超过550箱的概率为15.87%;

(2)B品牌:Z1=(260-300)/40=-1,Z2=(340-300)/40=1,P(-1≤Z≤1)=0.6826,故概率为68.

文档评论(0)

151****9429 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档