- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
前面讨论的简单随机抽样与分层抽样
(1) 为设定常数的情形 这种情况在实际应用中是存在的。比如为同一目的进行 的调查已重复进行多次,将以前数据中 关于 计算而得的 回归系数(倘若前几次该系数比较稳定在某一数值的话)直 接作为最新调查的 设定值。 首先研究这种简单回归估计值的期望。注意到 是 的 无偏估计, 又是 的无偏估计,因此,有: (5.30) 即回归估计量是总体平均数的无偏估计。 的方差可计算为: (5.32) 由(5.30)以及(5.32)可知,无论 是怎样的设定值, 总 是 的无偏估计,估计的精度与 的设定值有关。 (5.32)式的右端实际上是 的二次三项式,又由于 前的系 数为 是个正数,因此,只要适当选取 就可使 达 到最小值,利用高等数学的知识,可得使 达到最小 值的 应为: 其中 为 X 和 Y 的相关系数,此时最小方差为: (5.34) (5.33) (2) 取样本回归系数的情形 如果 需要估计而定,估计的原则总是使 达到最小 根据(5.33)式的启发,自然取: (5.35) 这实际上就是样本回归系数。利用 得到的回归,由于 是比值型随机变量,与比估计一样的理由, 不可能是总 体平均数的无偏估计。但当 n 相当大时,有下列近似结果: (5.36) (5.37) 因此,对简单随机抽样,当样本容量 n 相当大时,回归 估计 (不管 是否设定)的方差均近似地看作: 与简单随机抽样时 的简单估计 的方差相比,只要 , 则回归估计一定优于简单估计。 至于 的情况,则表示X与Y没有任何线性关系,那么 用X、Y的线性回归来估计 就相当于单纯依赖 去估计 回归估计与简单随机抽样时的比估计相比孰优孰劣呢? 当 n 相当大时,比估计的方差为: 欲使回归估计优于比估计,当且仅当: 即 或 (5.38) 这是一个当然的不等式。一般情况总是回归估计优于比估计 除非 ,此时这两种估计量效果几乎一样。 回归估计量的上述性质都是在样本容量 n 相当大时才成 立,当 n 偏小时容易产生较大偏倚,(5.36)式中关于1/n的同 阶无穷小这一项就蕴涵了这种可能性。 当 n 相当大时, 或 如何估计呢? 由于这两个参数的主要部分都是 ,因此,要 给出估计,只要将 S 换为 s,X、Y 换为 x、y,N 换为 n即可 形式上的估计可以写成 实质上是残差平方和,其自由度为(n-2),因此得到 或 的估计为: (5.39) 为样本回归系数 故 例5.3 (续例5.1)使用回归估计继续讨论某县小麦亩产与总产 量问题。 样本回归系数 小麦产量的估计为: 小麦总产量的估计为: 显见,回归估计比起比估计精度略高一点,但相差不大,它 们比简单估计则要精确的多! 2、分层随机抽样情况 与比估计情形一样,在分层随机抽样中考虑两种形式的 回归估计:分别回归估计与联合回归估计。 (1)分别回归估计 所谓分别回归估计,就是先在各层中对该层的平均数或 总和进行回归估计,然后再按层权平均或相加。 设第 h 层的样本平均数回归估计为 ,那么分别回归估计为 其中 分别为第 h 层的样本均值、回归参数。 (5.41) (5.40) 当各层的 为预先设定时,那么这两个估计量都是无偏估 计量。又由于各层抽样都是相互独立的,由(5.31)式立即可 得: (5.42) 并且当 时,达到最小值: (5.43) * * 前面讨论的简单随机抽样和分层抽样,我们所关心的参数都是单指标的,给出的估计量也是线性形式。这一章我们将要讨论比较复杂的情况,我们关心的参数不再是单指标的而是两个或两个以上的指标。此时,遇到的统计量不再是线性形式,往往呈现出非线性形式,比如两个变量之比,或呈现变量之间的回归关系。 第五章 比估计与回归估计 所谓回归关系就是变量之间的关系不是确定的,是带有
您可能关注的文档
最近下载
- 《关于促进人工智能和实体经济深度融合的指导意见》解读.pdf VIP
- 互联网数据中心基础设施监控系统北向接口规范V1.1.pdf VIP
- 软件配置管理计划(模板)-GJB438C.docx VIP
- 2024年3月17日多省(市、区)公务员考试《公安专业科目》真题及答案 .docx VIP
- 污水处理厂化验员工试题带答案.docx VIP
- 路基路面中线偏位试验检测记录表(坐标法).docx
- 广东省某焦化厂废水处理工艺设计.docx
- SY-T 5824-93钻杆分级检验方法.pdf VIP
- 2021届高三地理第一轮复习中国地理中国的自然环境专题跟踪训练.docx VIP
- 2021年12月12日江苏省公务员考试《公安专业科目》试题(网友回忆版).docx VIP
文档评论(0)