- 31
- 0
- 约 16页
- 2016-12-21 发布于湖北
- 举报
参数估计的基本方法
参数估计的基本方法一、点估计(Pointestimate)二、区间估计(intervalestimation)一、点估计点估计也称定值估计,就是直接以样本统计量作为总体参数的估计值。例如,设一批产品的废品率为θ。为估计θ,从这批产品中随机地抽出n个作检查,以X记其中的废品个数,用X/n估计θ,这就是一个点估计。点估计的优点是它提供了总体参数的具体估计值,可作为决策的依据,其缺点是不能提供有关抽样误差的信息。优良估计量的标准对同一总体参数,会有不同的估计量,作为一个好的点估计量,统计量必须具有如下性质:无偏性、有效性、一致性1、无偏性(Unbiasedness):样本估计量的均值等于被估总体参数的真值;2、有效性(Efficiency):好的点估计量应具有较小的方差;3、一致性(Consistency):当样本容量增大时,估计量依概率收敛于总体参数的真值。抽样估计的优良标准1.无偏性作为总体参数估计量的样本统计量,要求其期望值(平均数)等于被估计的总体参数。这样的估计量称为无偏估计量。2.有效性以抽样指标估计总体指标要求作为优良估计量的方差应比其它估计量的方差小。即方差越小的估计量就越有效3.一致性作为优良估计量的样本容量充分大时,抽样指标也应充分地靠近总体指标。一般情况下均可满足4.充分性估计量包含了样本中关于的全部信息三、区间估计(IntervalEstimation)(一)区间估计基本原理(二)总体均值的区间估计(三)总体比例的区间估计大数定律主要是说明:当n足够大时,独立同分布的随机变量的算术平均数趋近于数学期望;事件发生的频率接近于其发生的概率。即样本统计量接近于总体参数。因此,可以用样本平均数(或比例)估计总体平均数(或比例)中心极限定理是说明:当n充分大时,大量的起微小作用的相互独立的随机变量之和趋于正态分布。因此可以用正态分布来确定总体参数的估计范围(置信区间)和可靠程度(即概率或置信度)。(一)区间估计基本原理区间估计则是根据样本估计量以一定的可靠程度推断总体参数所在的区间范围。如果抽样分布已知,则在点估计中,可以知道抽样的点估计值与总体参数的离差在某一给定范围内的概率大小,即以一定的可靠程度知道以下抽样极限误差:3、区间估计方法理论因此,容易得到在抽样中,总体参数将以同样的可能性(概率)存在于下面的区间内:一般地,设总体参数为,L、U为由样本确定的两个统计量值,对于给定的(01),有则称(L,U)为参数的置信度为1-的置信区间,L、U分别称为置信下限与置信上限,为显著性水平,1-为置信度。置信区间(二)总体均值的区间估计区间估计就是根据样本求出总体未知参数的估计区间,并使其可靠程度达到预定要求。(1) 总体方差σ2已知时由于,所以对于给定的置信度1-α,有即可见,极限误差的计算公式为则总体均值的置信区间为例:从某大学学生中随机抽取100名调查体重情况。经称量和计算,得到平均体重为58千克。根据过去的资料知道大学生体重的标准差是10千克。在95%的置信水平下,求该大学学生平均体重的置信区间。解:已知=58,σ=10,zα/2=1.96,n=100=10/10=1(千克)=1.96×1=1.96(千克)置信下限为58-1.96=57.04,置信上限为58+1.96=59.96故所求置信区间为(57.04,59.96)千克。例:某进出口公司出口一种名茶,规定每包重量不低于150克。现不重复抽取1%检验,结果如下。以95.45%的概率估计这批茶叶平均每包重量范围,以确定该批茶叶是否达到要求。每包重量(克)包数xxf148——149149——150150——151151——15210205020148.5149.5150.5151.5148529907525303032.412.8228.8合计100——1503076(2) 总体方差σ2未知时用s2代替σ2,对于给定的置信度1-α,总体均值的置信区间为在大样本条件下,若,则样本比例趋近于正态分布。对于给定置信度,有总体比例的置信区间为(三)总体比例的区间估计例:总体比例的区间估计【例】某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间解:已知n=100,p=65%,1-=95%,z/2=1.96该城市下岗职工中女性比例的置信区间为55.65%~74.35%
原创力文档

文档评论(0)