- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据分析基础水平测试题及答案
一、单项选择题(每题3分,共30分)
下列统计量中,不受极端值影响的是()
A.算术平均数B.中位数C.极差D.方差
某电商平台统计1000名用户的日消费金额,想反映数据的分布形态,最适合使用的图表是()
A.折线图B.饼图C.直方图D.散点图
已知一组数据的标准差为2,则其方差为()
A.1B.2C.4D.8
在回归分析中,R2(决定系数)的取值范围是()
A.[0,1]B.[-1,1]C.[0,+∞)D.(-∞,+∞)
抽样调查中,为了保证样本的代表性,最合适的抽样方法是()
A.方便抽样B.分层抽样C.自愿抽样D.判断抽样
某产品的合格率为95%,现随机抽取20件产品,其中合格产品数服从()
A.正态分布B.二项分布C.泊松分布D.均匀分布
下列关于相关系数r的说法,错误的是()
A.r=0表示变量间无线性相关关系B.|r|越接近1,线性相关程度越强
C.r=1表示完全正相关D.r为负数时,变量间无相关关系
描述数据离散程度的指标不包括()
A.四分位距B.众数C.标准差D.变异系数
对两组数据进行均值比较,当样本量较小时且总体方差未知时,应使用()
A.Z检验B.t检验C.χ2检验D.F检验
数据清洗过程中,处理缺失值的常用方法不包括()
A.删除法B.替换法C.预测法D.保留法
二、填空题(每题4分,共20分)
描述数据集中趋势的三大核心指标是:平均数、__________和众数。
概率的基本性质中,互斥事件A和B的并事件概率P(A∪B)=__________。
箱线图通过__________、上四分位数、下四分位数、最大值和最小值五个关键数据点展示数据分布。
简单线性回归方程的表达式为?=a+bx,其中b称为__________。
数据预处理的主要步骤包括:数据清洗、数据集成、数据变换和__________。
三、计算题(每题15分,共30分)
某班级10名学生的数学考试成绩分别为:85、78、92、88、90、75、82、86、95、80。
要求:(1)计算该组数据的算术平均数和中位数;(2)计算该组数据的标准差(保留两位小数)。
某超市销售两种品牌的饮料,A品牌的月销售量服从均值为500箱、标准差为50箱的正态分布,B品牌的月销售量服从均值为300箱、标准差为40箱的正态分布。
要求:(1)计算A品牌月销售量超过550箱的概率;(2)计算B品牌月销售量在260-340箱之间的概率(已知正态分布中,P(-1≤Z≤1)=0.6826,P(Z1)=0.1587)。
四、案例分析题(20分)
某手机厂商收集了100款手机的售价(单位:元)和续航时间(单位:小时)数据,进行相关性分析和回归分析,得到以下结果:
相关系数r=0.85;
回归方程:?=10+0.01x。
请回答以下问题:
解释相关系数r=0.85的含义;
解释回归方程中系数0.01的经济意义;
若某款手机的售价为3000元,预测其续航时间;
结合分析结果,说明手机售价和续航时间的关系对厂商定价和产品设计的启示。
参考答案
一、单项选择题
B2.C3.C4.A5.B6.B7.D8.B9.B10.D
二、填空题
中位数2.P(A)+P(B)3.中位数4.回归系数(或斜率)5.数据规约
三、计算题
(1)算术平均数:
\bar{x}=\frac{85+78+92+88+90+75+82+86+95+80}{10}=85.1
将数据排序:75、78、80、82、85、86、88、90、92、95,中位数为第5、6项的平均值:
\text{??-?????°}=\frac{85+86}{2}=85.5
(2)标准差:
s=\sqrt{\frac{\sum_{i=1}^{10}(x_i-\bar{x})^2}{n-1}}=\sqrt{\frac{408.9}{9}}\approx6.74
(1)A品牌:Z=(550-500)/50=1,P(Z1)=0.1587,故超过550箱的概率为15.87%;
(2)B品牌:Z1=(260-300)/40=-1,Z2=(340-300)/40=1,P(-1≤Z≤1)=0.6826,故概率为68.
原创力文档


文档评论(0)