- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
.
..
《应用统计学》复习要点
(要求:每人携带具有开方功能的计算器)
一、名词解释
1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
2.方差分析:是通过分析数据的误差判断各总体均值是否相等,研究分类型自变量对数值型因变量的影响,分为单因素方差分析和双因素方差分析。
3.假设检验:是事先对总体参数或分布形式做出某种假设,然后利用样本信息来判断原假设是否成立。分为参数假设检验和非参数假设检验。一般采用逻辑上的反证法,依据统计上的小概率原理。
4.置信区间:是指由样本统计量所构成的总体参数的估计区间。在统计学中,一个概率样本的置信区间是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的成都。
5.置信水平:是指总体参数值落在样本统计值某一区内的概率。
6.抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。
7.方差分析:是通过分析数据的误差判断各总体均值是否相等,研究分类型自变量对数值型因变量的影响,分为单因素方差分析和双因素方差分析。(重复啦)
8.相关分析:是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度是研究随机变量之间的相关关系的一种统计方法。
9.推断统计:是研究如何利用样本数据来推断总体特征的统计方法。包含两个内容:参数估计,即利用样本信息推断总体特征;假设检验,即利用样本信息判断对总体的假设是否成立。
二、计算题
1. 在某地区随机抽取120家企业,按照利润额进行分组后结果如下:
按利润额分组(万元)
企业数(个)
300以下
19
300~400
30
400~500
42
500~600
18
600以上
11
合计
120
计算120家企业利润额的平均数和标准差(注:第一组和最后一组的组距按相邻组计算)。
解:
2.某银行为缩短顾客到银行办理业务等待的时间,准备了两种排队方式进行试验。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:
5.5
6.6
6.7
6.8
7.1
7.3
7.4
7.8
7.8
计算第二种排队时间的平均数和标准差。
比较两种排队方式等待时间的离散程度。
如果让你选择一种排队方式,你会选择哪一种?试说明理由。
解:
3. 某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他们每天上网的时间(单位:小时),得到的数据如下:
3.3
3.1
6.2
5.8
2.3
4.1
4.4
2.0
5.4
2.6
6.4
1.8
2.1
1.9
1.2
5.1
4.3
4.2
4.7
1.4
1.2
2.9
3.5
2.4
5.4
3.6
4.5
0.8
3.2
1.5
3.5
0.5
5.7
3.6
2.3
2.5
求该校大学生平均上网时间的置信区间,置信水平分别为90%,95%和99%。(注:z(0.1)、z(0.05)和z(0.01)统计量值分别为1.65、1.96和2.58)
解:
4. 利用下面的信息,构建总体均值μ的置信区间。
(1)总体服从正态分布,且已知σ=500,n=15, QUOTE =8900,置信水平为95%。(注:z统计量值为1.96)
(2)总体不服从正态分布,且已知σ=500,n=35, QUOTE =8900,置信水平为95%。(注:z统计量值为1.96)
(3)总体不服从正态分布,σ未知,n=35, QUOTE =8900,s=500,置信水平为90%。(注:z统计量值为1.65)
(4)总体不服从正态分布,σ未知,n=35, QUOTE =8900,s=500,置信水平为99%。(注:z统计量值为2.58)
解:
5.对消费者的一项调查表明,17%的人早餐饮料是牛奶。某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐 饮用牛奶。在α=0.05的显著性水平下,检验该生产商的说法是否属实?(注:z统计量值为1.96)
解:
6.一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为7.25小时,标准差为2.5小时。据报道,10年前每天每个家庭看电视的平均时间是6.7小时。取显著性水平α=0.01,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?(注:z统计量值为1.96)
解:
7.下面是7个地区2000年的人均国内生产总值GDP(Y)和人均消费水平(X)的统计数据(注:此题对应的t统计量值
文档评论(0)