第五章总哈体参数的估计.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章总哈体参数的估计

第五章 总体参数的估计 用Excel,z值=Normsinv(1-a/2)求值 用Excel,t值=TINV(1-置信水平,自由度),t值=tinv(a,自由度)求值 §5.1 用估计量估计总体参数 演绎法和归纳法: 从一个已知总体开始,讨论样本具有怎样的性质、样本均值能如何接近总体的均值μ。这就叫演绎法--------由一般(总体)去推证特殊(样本)。 从抽取的一个已知出发,问对被抽样的未知总体可以作出什么结论。这就叫归纳法,或叫统计推断-------由特殊(样本)去推证一般(总体)。 样本与总体: 在一个总体中,均值μ和方差σ2虽然一般都是未知的,但它们却是固定的常数,记住这点是非常重要的。这些常数叫做总体参数。相反地,样本均值是一随机变量,它随样本而变化,它的分布是近似正态的。象这样的随机变量是通过样本中的观测值计算出来的,专门名称叫做样本统计量。用于估计的统计量叫做估计量,抽取一个样本,估计量就有了一个数值,这个数字称为该估计量的一个实现或取值,也称为一个估计值。 点估计和区间估计: 点估计:是用作未知总体参数估计值的单一数值。用估计量的实现值来近似相应的总体参数 总体参数的区间估计:就是我们有相当把握认为参数位于其间的两个数值的陈述。 置信区间估计:我们可能十分相信,又可能不大相信总体参数包含在区间估计的区域内,因此,必须对这一区间附加一些概率的陈述。用以作出这一概率陈述的方法是置信区间估计。 §5.2 点估计 用什么样的估计量来估计参数呢? 实际上没有硬性限制。任何统计量,只要人们觉得合适就可以当成估计量。当然,统计学家想出了许多标准来衡量一个估计量的好坏。 什么是好估计量的标准呢? 无偏性、一致性、有效性 1. 无偏性。无偏性的直观意义是没有系统性误差。虽然每个可能样本的估计值不一定恰好等于未知总体参数,但如果多次抽样,应该要求各个估计值的平均数等于总体参数,即从平均意义上,估计量的估计是没有偏差的。这一要求称为无偏性。一般来说,这是一个优良的估计量必须具备的性质。例如样本平均数和样本成数分别满足: (6.3) 式中,E表示数学期望,即算术平均数,所以样本平均数(成数)是总体平均数(成数)的无偏估计。 2. 一致性。一致性要求用样本估计量估计和推断总体参数时要达到:样本容量n充分大时,样本估计量充分靠近总体参数,即随着n的无限增大,样本估计量与未知的总体参数之间的绝对离差任意小的可能性趋于实际的必然性。根据概率论中的大数定律可知:对于任意给定的正数有: (6.4) 上式表明,当样本容量越来越大时,样本平均数(样本成数)与总体平均数(总体成数)的偏差小于任意给定的正数的可能性趋近于1的概率,即几乎是一定发生的。因此,样本估计量是总体参数的一致估计量。 3. 有效性。有效性要求样本估计量估计和推断总体参数时,作为估计量的标准差比其它估计量的标准差小。如果一个无偏估计量在所有无偏估计量中标准差最小,即: (6.5) 式中,为任意一个无偏估计量,则是有效估计量,或称该估计量具有有效性。显然,如果某总体参数具有两个不同的无偏估计量,希望确定哪一个是更有效的估计量,自然应该选择标准差小的那个。估计量的标准差愈小,根据它推导出接近于总体参数估计的值的机会愈大。 我们可以证明:样本平均数(成数)推断总体平均数(成数)均能满足优良估计的三条标准。 §5.3 区间估计 当描述一个人的体重时,你一般可能不会说这个人是76.35公斤。你会说这个人是七八十公斤,或者是在70公斤到 在抽样调查例子中也常用点估计加区间估计的说法。 比如,为了估计某电视节目在观众中的支持率(即总体比例p),某调查结果会显示,该节目的“收视率为90%,误差是±3%,置信度为95%”云云。这这种说法意味着下面三点 1. 样本中的支持率为90%,即用样本比例作为对总体比例的点估计 2. 估计范围为90%±3%(±3%的误差),即区间(93%,87%)。 3. 如用类似的方式,重复抽取大量(样本量相同的)样本时,产生的大量类似区间中有些会覆盖真正的p,而有些不会;但其中大约有95%会覆盖真正的总体比例。 这样得到的区间被称为总体比例p的置信度(confidence level)为95%的置信区间(confidence interval)。这里的置信度又称置信水平或置信系数:1-。 :显著性水平 显然置信度的概念又是大量重复抽样时的一个渐近概念。 因此说“我们目前得到的区间(比如上面的90%±3%)以概率0.95覆盖真正的比例p”是个错误的说法。 这里的区间(93%,87%)是固定的,而总体比

文档评论(0)

173****1616 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档