- 8
- 0
- 约3.45千字
- 约 7页
- 2018-11-30 发布于江苏
- 举报
比率估计回归估
Ratio and Regression Estimator
引例:1802年,拉普拉斯想要估计法国的人口数目。他获得了一个遍布全国范围的30个社区(commune)的样本,截至1802年9月23日总共有2037615居民。在包括1802年9月23日以前的三年中,215599个新生儿在30个commune。拉普拉斯认为30个commune的每年注册的新生儿数为215599/3=71866.33。把2037615
一、为什么要使用比率估计/回归估计
利用总体的辅助信息提高估计的精度。辅助指标的选择:第一,辅助指标应该与调查指标有较好的正的相关关系。第二,的抽样分布较的抽样分布变动性要小得多。第三,辅助指标的总体总量或总体均值已知。比率估计、回归估计需要有足够的样本量才能保证估计的有效。有偏估计:当样本量足够大时,估计的偏倚趋于0。
简单地想要估计一个比率:假定总体由面积不同农业用地构成,地谷物的产量,地的面积,B=每亩谷物的平均产量。
想要估计一个总体总数,但总体大小N是未知的。但是我们知道,于是可以通过来估计N,由此我们可以使用不同于总数N的方法而是采用辅助变量来进行测量。
要估计渔网中长度长于12cm的鱼的总数,抽取一个鱼的随机样本,估计长度长于12cm的鱼所占的比例,用鱼的总数N乘以这个比例即可得到,但如果N未知不能使用。能称量渔网中鱼的总重量。鱼的长度与其重量相关。
调整来自样本的估计量以便它们反映人口统计学的总量。在一所具有4000名学生的大学提取一个400个学生的简单随机样本,此样本可能包含240个女性,160个男性,且其中被抽中的84名女性和40名男性计划以教学为毕业后的职业。
以教学为职业的总量估计:
调整后的总量估计:
比率估计量被用来对无回答进行调整。设抽取一个行业的样本:令为行业花费在健康保险上的金额,为行业的雇员数。假定对总体中的每个行业均已知.我们希望一个行业花费在健康保险上的金额与雇员数相关。某些行业在调查中可能涉及不到。估计保险费用的总花销时调整无回答的方法之一是用总体数乘以比率 。
二、Ratio Estimator
在SRS条件下,辅助指标,其总体均值(总量)已知,则有:
例1,对以下假设总体(N=6),用简单随机抽样抽取的样本,比较简单随机抽样比估计及简单估计的性质。
序号
1
2
3
4
5
6
平均值
0
1
3
5
8
10
4.5
1
3
11
18
29
46
18
样本
y
y1
x
x1
简单估计
比率估计
1
1,2
1
3
0
1
2
18
2
1,3
1
11
0
3
6
18
3
1,4
1
18
0
5
9.5
17.1
4
1,5
1
29
0
8
15
16.875
5
1,6
1
46
0
10
23.5
21.15
6
2,3
3
11
1
3
7
15.75
7
2,4
3
18
1
5
10.5
15.75
8
2,5
3
29
1
8
16
16
9
2,6
3
46
1
10
24.5
20.04545
10
3,4
11
18
3
5
14.5
16.3125
11
3,5
11
29
3
8
20
16.36364
12
3,6
11
46
3
10
28.5
19.73077
13
4,5
18
29
5
8
23.5
16.26923
14
4,6
18
46
5
10
32
19.2
15
5,6
29
46
8
10
37.5
18.75
总共抽取个样本,简单估计为:,比率估计:。
;
;
(偏倚程度);
评价:简单估计是无偏的,而比估计是有偏的。简单估计量的方差远远大于比估计量的方差,比估计的偏差不大,其均方误差也比简单估计的小得多。因此对这个总体,比估计比简单估计的效率高。
三、比率估计的性质
偏倚量会小,如果:样本量很大;抽样比很大;很大;很小;相关系数接近于1。
比率估计的近似方差:
;
四、比率估计的效率
1、与简单估计的比较
简单估计量无偏,而比率估计量渐近无偏。因此这里只比较当n比较大的情形。
比率估计量优于简单估计量的条件是:
(正高度相关)
2、比率估计成为最优线性无偏估计的条件
(1)与的关系是过原点的直线。(2)对这条直线的方差与成比例。则比率估计是最优线性无偏估计(BLUE)。
例2,某县在对船舶调查月完成的货运量进行调查时,对运管部门登记的船舶台帐进行整理后获得注册船舶2860艘,载重吨位154626吨,从2860艘船舶中抽取了一个的简单随机样本,调查得到样本船舶调查月完成的货运量及其载重吨位如下表(单位:吨),要推算该县船舶调查月完成的货运量。
1
780
100
6
2170
120
2
1500
50
7
1823
150
3
1005
50
8
1450
80
4
376
10
9
15
您可能关注的文档
最近下载
- 电线电缆单根垂直燃烧试验影响因素的探讨.doc VIP
- 第七章 概率于随机变量 第七章 随机变量及其分布(章末小结)课件(人教A版选择性必修第三册).pptx VIP
- 《选择性必修三》随机变量及其分布 随机变量及其分布复习与小节第2课时.pdf VIP
- 质量管理体系过程相互关系图3.pptx VIP
- 中央监护系统技术参数要求2套.doc VIP
- 《软件工程》课程教学大纲.pdf VIP
- 第七章随机变量及其分布(单元复习课件)(人教A版2019选择性必修第三册).pptx VIP
- 闽南语‘契兄’与客家话‘契哥’的语义发展文字误用及时代竞争.PDF
- 国电集团财务信息系统应用手册.pdf VIP
- DB50_T 1262-2022 儿童孤独症康复机构服务规范.docx VIP
原创力文档

文档评论(0)