- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
                        查看更多
                        
                    
                估计理论
   数理统计的实质就是利用职样本的信息对总体作推断,统计推断主要包括统计估计与假设检验两大部分。所谓统计估计就是利用样本的信息对总体的分布或者总体的数字特征作出估计。主要包括两大类
第一类:已知总体的分布的类型(如二项分布,泊松分布,正态分布等),只对其中未知参数作估计。这一类估计方法成为参数估计。另外在有些实际问题中,事先并不知道总体服从什么分布,而要对其中数字特征,如数学期望及方差做出估计,由于随机变量的数字特征与其概率分布中的参数有一定关系,因而对数字特征的估计问题也称为参数估计问题。
第二类:总体的分布类型未知,要对其分布(包括类型及其中参数)做出估计。这一类估计成为非参数估计。非参数估计要比参数估计复杂得多,困难得多。一般情况下,非参数估计分两个步骤进行,首先估计出总体的分布类型,其次再利用参数估计方法估计未知参数。
§2.1  经验分布函数与直方图
经验分布函数可利用总体的分布函数,直方图可用来估计总体的分布密度函数。
2.11 经验分布函数
设总体不X,为X的一个样本观测值,将其按从小到大的顺序排列
                                               (2.1)
定义函数如下:
                          (2.2)
称为经验分布函数或样本分布函数,它恰好为在n次重复试验中事件“”的频率。由大数定律,当n充分大时,频率接近概率,即
         
可较好地反映总体的分布函数。因此可用去估计总体。格利文科得到了更强的结论。
格利文科(W.Glivenko)定理:当时,依概率1关于x均匀地收敛于,即
                               (2.3)
证明参见文献[  ]
注:经验分布函数为阶梯型函数,当总体X为连续型随机变量时,作的图形比较困难,因此在实际中还是很少使用此种方法。
2.1.2  频率表
当总体X为离散型随机变量时,我们可用频率表来估计X的概率分布。
例2.1  从一批布中取疋,检查其中每疋上疵点个数,得到样本。现将样本中10个数从小到大的顺序排列,并将相同的数合并,并且记下重复的次数,得到如下表
x
0      1       2       3       4
频数mi
1      2       3       3       1
我们称上表为频数分布表,将上表中的频数除以样本容量10,就得到频率分布表
x
0      1       2       3       4
频率fi
0.1    0.2     0.3     0.3     0.1
一般地,当总体为离散型总体时,先将样本按从小到大的顺序排列,并将相同的数合并,得到样本中不同的数值。并统计出频数,列出如下表
           …      
频数mi
          …        
频率fi
          …        
这个表就是频率分布表。利用频率接近概率的原则,当n充分大时,上表就可看作总体X得概率分布。
2.1.3  直方图
当总体为连续型总体时,频率表就不能反映总体的分布了,此时应采用直方图方法。
例2.2  设从一批钉子中,抽取200只测量其长度,得到如下数据:
x
频数
  x
频数
  x
频数
  x
频数
  x
频数
13.13
  1
13.29
6
13.39
7
13.49
 1
13.59
 2
13.14
  1
13.30
2
13.40
12
13.50
 6
13.60
 1
13.18
  1 
13.31
5
13.41
4
13.51
 6
13.61
 1
13.20
  3
13.32
7
13.42
6
13.52
 5
13.62
 3
13.23
  2
13.33
6
13.43
9
13.53
 4
13.63
 1
13.24
  3
13.34
7
13.44
6
13.54
 4
13.64
 1
13.25
  1
13.35
4
13.45
7
13.55
 3
13.66
 1
13.26
  4
13.36
3
13.46
7
13.56
 3
13.69
 1
13.27
  1
13.37
6
13.47
3
13.57
 4
13.28
  5
13.38
10
13.48
9
13.58
 5
分析其中数据,最小值为13.13,最大值13.69。现将它们分成10组,每组区间长度为0.06,称为组距,记为  ,区间的中点称为组中值。分组后按组统计出频数和频率:
各组范围
频数
频率
13.095~13.145
13.12
2
0.010
0.2
13.145~13.195
13.17
1
0.005
0.1
13.195~
                 原创力文档
原创力文档 
                        

文档评论(0)