第5章比估计和回归估计.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章比估计和回归估计

Chap5比估计和回归估计教学要求:重难点:引语:(请学生回顾)前面介绍过的目标量有四个类型:总体均值、总体总量、总体比例、两个指标的总数或均值的比值R,在简单随机抽样和分层抽样中讨论的目标都是前三类,且它们本质上是一类,相互之间可类推。本章讨论第四类目标量比值R的估计,这是第一个问题。比如服装消费支出占总支出的比值,在校儿童对全体儿童的比重。其次前面所用的估计量是简单估计,它只涉及所估计的指标本身。如果有另一个和Y关系密切(比例关系或线性回归关系)的指标X可作为辅助变量,来构造另一类估计量,即比估计量或回归估计量,来提高估计精度,这是第二问题。如调查每月每户平均消费,消费通常和每户人口数密切相关,可用每户人口数作为辅助变量,先估计每月每户平均消费和每户人口数的比值R,然后利用已知的每户平均人口,就可得到每月每户平均消费的估计值。由于这两个问题之间存在密切的内在关系,因此放在这一章节一起讨论。5.1比估计基本概念考虑到有两个指标量Y和X,不妨将总体记为,对应样本为,如果要估计的是总体比值,则总体比值R可用样本的比值进行估计,该估计量称为比值估计量.当调查指标仅为Y,X为辅助变量时,在或已知时,和Y可用    分别进行估计,称为比(比率)估计量.这三者通称为比估计量,它们之间只相差一个常数,相互之间可推导,研究时只选择一个即可.性质我们知道简单估计量是无偏估计,其均值误差等于其方差.但对于比估计量却不具有无偏性,而是渐近无偏.其均值误差和方差有差异,但偏倚不大.可证:对于简单随机抽样,当n很大时,  简要证明:当n很大时,,代入上式分母中,有所以,当n很大时.此时对每个总体单元,令,对每个样本单元有,则其总体均值和样本均值分别为  因而    =所以,当n很大时  此方差的估计量可采用或         说明:这两个方差估计量很难比较谁优谁劣,对不同总体有不同结论。类推可得:对于简单随机抽样,当n很大时,,  ,  , , 【例1】(冯P130例5.3)交通运输统计中有三个重要的指标,即运量、周转量和平均运距,其中平均运距是总周转量除以运量所得的商。为估计公路载货汽车的平均运距,在总体中用简单随机抽样抽取32辆货车,记录每辆车在一个月内的运量xi(单位吨)和周转量yi (单位吨公里),如P130表5.3所示,试估计平均运距R并给它的90%的置信区间。解:,,,故平均运距R的估计值为为求方差估计值,令1-f=1,R的90%的置信区间为比估计和简单估计的比较简单估计法以样本均值估计总体均值,比估计以估计,两者的估计方差为 EMBED Equation.3 由于样本方差和样本协方差是总体方差和总体协方差的无偏估计,所以的一个近似估计是即其中 EMBED Equation.3 是指标X和Y的总体相关系数.比估计优于简单估计的条件是      (*)其中:,分别是总体Xi和Yi的变异系数.*式说明在估计时,如果有和指标Y相关系数较大的辅助指标X,而且X的变异系数比较小,则用比估计法的有利的.即X的变异系数和Y的变异系数相当,当相关系数ρ大于1/2时,比估计比简单估计更优.5.2回归估计有效运用比估计的一个前提是Y和辅助变量X基本上成(正)比例关系,即Yi对Xi的回归直线通过原点。若Yi对Xi的回归直线不通过原点,为了进一步提高精度,则应使用回归估计。对于简单随机抽样,总体均值和总量Y的(线性)回归估计量定义为:     其中是样本均值,β可以是:(1)事先设定的常数;(2)从样本中计算得到的某一特定统计量,如样本回归系数。下面例举几种回归估计的特殊情况。(1)当时的回归估计量称为差估计量(difference estimator):(2)当时,即为简单估计量。(3)当时,则即比估计量。我们知道简单估计是无偏估计,而比估计是渐近无偏的,也就是说β为设定常数和β为某一统计量对回归估计在性质上有很大的不同,下面分别进行讨论。1.β为设定常数令β0是设定常数,易证回归估计量是的无偏估计。求它的方差时,可视为的样本均值,所以可用简单估计量的方差公式: EMBED Equation.3 由于样本方差和样本协方差是总体方差和总体协方差的无偏估计,因此的一个无偏估计是      β0的不同取值会影响值,若取值合理,就小,否则就大。若要最小,则最小。对β0求导,则,即为Y对X的总体回归系数B时,取得最小值     .2.β为样本回归系数Y对X的总体回归系数B一般是未知的,自然人们常用其样本回归系数b,估计B,此时总体均值的回归估计为  可以证明,当n大时,以估计是近似无偏的;其均方误差近似为理论上的最小值,即     此式中的可用以下样本残差方差进行估计: 所以的一个近似估计式为  3.回归估计和简单估计和比估计的比较将回归估计(β

文档评论(0)

jgx3536 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档