- 1、本文档共53页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章 比估计与回归估计
第七章 比估计与回归估计 第七章 比估计与回归估计 [教学目的] 通过本章的教学,使学生了解比率估计、回归估计的意义;掌握简单随机抽样的比率估计、回归估计的方法以及差值估计的方法等。 本章结构 (4)分层随机抽样分别比估计 (5)分层随机抽样联合比估计 从以上五种情况的结果分析,两种简单估计的精度较差 因为他们没有充分利用已知的 及 的信息,三种比估计由 于利用了 的信息,显然精度大大提高了。 同时我们注意到分层随机抽样的两种比估计比起简单随 机抽样的比估计效果略好一些,这是因为在实际测量中已分 的三层的确有所区别。 最后我们指出,在分层随机抽样中,分别比估计与联合 比估计有着几乎差不多的效果,这正是我们在正文中所阐述 的理由,当每层抽样容量 不很大时,联合比估计不比分别 比估计来的差。 一个有趣的事实是对于 的估计,恰好三个比估计比起两个简单估计要略低一些,由于随机性,当然我们不能指认到底哪一个估计比较接近事实,但是三种比估计统统略低会使我们产生这样一个想法:这是否会是由于比估计本身时有偏性而引起的呢?对于上面具体例子,我们缺乏根据说它们偏小了些。但是比估计的有偏性却在理论上是无法否认的事实,调查工作者与统计学家一直在设法尽力减少偏差,这称为估计量的“纠偏”。 §7.4 回归估计量 前面讨论的比估计之所以能在精度方面获益匪浅,是因 为我们充分利用了已知的辅助变量 X 的信息,而且这个辅助 变量 X 与我们所关心的变量 Y 之间有着密切的关系,这种关 系越密切,对 Y 的某些指标的估计精度就越高。 现在假定变量Y与X之间存在着线性回归关系(但不是通 过原点),又假设X的信息已知或部分已知,我们想利用X的 信息提高对Y的估计精度。 1、简单随机抽样情况 设从总体 中随机无放回的抽取样本 ,若变量 关于 的回归直线不通过 原点,具有如下形式: (7.26) 的回归值 估计为 相应的,总体总和 的回归估计为: 这里 可以是一个设定的常数,也可以是估计得到的回归 系数。例如,若设定 ,则 即为简单估计量; 若令 是一个估计量,则 其中 是 的估计量。为方便起见,记 ,我们可 以用所有 N个 的回归值 的平均值来估计总体平均数 这样就得到 的线性回归估计,倘若 已知,有: 即为比估计量。可见回归估计包含简单估计和比估计。 (7.27) (7.28) (7.29) (1) 为设定常数的情形 这种情况在实际应用中是存在的。比如为同一目的进行 的调查已重复进行多次,将以前数据中 关于 计算而得的 回归系数(倘若前几次该系数比较稳定在某一数值的话)直 接作为最新调查的 设定值。 首先研究这种简单回归估计值的期望。注意到 是 的 无偏估计, 又是 的无偏估计,因此,有: (7.30) 即回归估计量是总体平均数的无偏估计。 的方差可计算为: (7.31) 由(7.30)以及(7.31)可知,无论 是怎样的设定值, 总 是 的无偏估计,估计的精度与 的设定值有关。 (7.31)式的右端实际上是 的二次三项式,又由于 前的系 数为 是个正数,因此,只要适当选取 就可使 达 到最小值,利用高等数学的知识,可得使 达到最小 值的 应为: 其中 为 X 和 Y 的相关系数,此时最小方差为: (7.33) (7.32) * [重点与难点] 本章的重点是简单随机抽样的比率估计、回归估计的方法以及差值估计的方法等;难点是简单随机抽样的比率估计、回归估计的方法。 §7.1 比估计及其性质 §7.2 分层抽样中的比估计 3. §7.3 数值例子 4. §7.4 回归估计量 前面讨论的简单随机抽样和分层抽样,我们所关心的参数都是单指标的,给出的估计量也是线性形式。这一章我们将要讨论比较复杂的情况,我们关心的参数不再是单指标的而是两个或两个以上的指标。此时,遇到的统计量不再是线性形式,往往
文档评论(0)