第一节 抽样分布.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章 抽样分布导引统计的根本目的是用样本推断总体。由于样本数据是杂乱无章的,很难直接看出有价值的东西。当我们从总体中抽取一个样本后,并不能直接应用它去对总体的性质进行推断,必须对样本数据进行加工和提炼,把分散在样本中与所研究问题有关的信息集中起来。统计学最主要的提取信息的方式就是对样本数据进行一定的运算,以算出某些代表性的数字,足于反映出数据某些方面的特征,这些数字被称为统计量。不同统计问题所采用的统计量不同。衡量一种统计方法的好坏,不能用某一个样本的具体结果来衡量。由于抽样的随机性,从总体中可能取到不同的样本,导致统计量的取值进而统计分析的结果也不同。统计量是样本的函数,是随机变量,其概率分布称为抽样分布。借助统计量的抽样分布,我们计算统计量在各种可能样本取值的中心位置和变异程度,从整体上考察统计方法的优良性。统计问题的解决,取决于找到该方法中使用的统计量的抽样分布。从理论上推导统计量的精确分布很困难,仅限于少数如总体分布为正态的情况,更多的情况是借助中心极限定理这样的大样本方法,得到统计量的近似分布。通过计算机在总体中反复抽样,用统计量的经验分布代替理论分布,是解决问题的另一种途径。通常把这叫做“统计模拟法”或“Monte Carlo法“。本章在介绍以上统计学概念、思想和方法的基础上,重点介绍解决农业和生命科学领域经常遇到的一些统计问题所使用的统计量,以及这些统计量的抽样分布和概率计算。本章内容是理解统计方法背后逻辑和正确解读统计结果的关键。第一节随机抽样和无偏估计一、总体和样本研究对象的全体称为总体,组成总体的每一个对象叫做“个体”或“单元”。如想要了解某地区水稻的平均亩产量如何,总体由该地区的所有稻田组成,每一块稻田是这个总体的一个“个体”或“单元”。确定问题的总体,也就是确定所研究问题的范围。如我们对全国水稻的平均亩产量感兴趣,则总体扩大为由全国所有稻田组成。一个总体中所包含的个体数目称为总体容量,用表示。如果总体中所包含的个体数目是有限的,这样的总体称为有限总体。如上面全国所有稻田组成的总体,尽管数目很大,但仍是有限的。在一些问题中,总体中的个体不是现成摆着的,且其存在只能凭想象,总体中所含个体数目为无限,这种总体叫无限总体。现举一两个例子。1.田间试验以估计水稻新品种的亩产量。此问题中,每一块参与试验的田块都是一个个体,所有可以想象的这种田块组成这个问题的总体。这总体中的个体不是早就等在那里让你去抽,你不去试验,就没有这种个体,每选择一块田块进行试验,就“制造”出一个个体,原则上总体中的个体是无限的。2.调查某地块1平方尺金针虫头数。这里,此地块任何1平方尺小块都是一个个体。在抽样前,此地块并没有自然地分成1平方尺一小块,你可以在此地块划出无数块不同形状和位置并且不同小块间可以部分重叠的1平方尺小块,因而总体中包含无限个个体。3.在天平上称一物件以估计其重量。这时,每次称量的结果都是一个个体,所有可以想象的这种称量的结果的全体,构成这个问题的总体。这也是一个其存在只能加以想象的无限总体。总体中的个体不是现成摆着的,每称量一次,就造出这样一个个体。总体中的个体通常直接用其指标值来表示,如某个体的指标值为,我们就说该个体为。总体中个体指标值的概率分布或概率密度函数叫做总体分布。如果总体中个体的指标值服从分布,我们就说该总体为总体。比如某地区水稻亩产量服从正态分布,我们说该地区稻田是正态总体。用来描述总体特征的概括性数字称为参数,如总体平均数、总体方差、总体比例等。在统计中,总体参数通常用希腊字母表示。比如,总体平均数用表示,总体方差用表示,总体比例用表示,等等。由于总体数据通常是未知的,所以参数是一个未知的常数。为推断总体某方面的特征,必须从总体中抽出一部分个体,由总体中抽出的部分个体称为样本。往往我们感兴趣的只是个体上的某个指标值,因此样本中的个体也直接用其指标值来表示。如上面某地区所有稻田组成的总体,从该总体中抽取块稻田,所抽出的这块稻田的亩产量就组成样本,用表示,其中是样本中所包含的个体数,称为样本容量。统计方法的好坏,不是用某一个样本的具体结果来衡量,而要从整体来衡量,正如两个品种,一般说来甲品种优于乙品种,但在某次试验中,乙品种的表现又优于甲品种。我们说甲品种优于乙品种,是从一个较长时间的完整表现上去考察的。比较统计方法的好坏,也是这个道理。要从整体上衡量统计方法的好坏,首先要知道从总体中可能取到什么样的样本,因此统计学把样本看作随机变量,以研究样本取值的统计规律性。“样本是随机变量“是统计学最重要的观念。如果只习惯于样本是一堆数字,就无法理解统计方法背后的逻辑,也无法对统计结果作出合理的解释。因此,要学好统计学,首先要树立“样本是随机变量”这个基本观点。从样本出发,要得到有关总体的某项性质,就必须对样

文档评论(0)

189****6140 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档