- 1、本文档共35页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 参数估计
统计研究的基本问题之一根据样本所提供的信息,对总体的分布及分布的数字特征作出推断。统计推断主要包括两部分内容:一是参数估计;二是假设检验。这一章主要讨论参数估计的理论和方法。
实际问题中我们经常遇到不知道总体的分布,或虽然知道总体的分布,但我们所关心的是总体的某些参数(往往是总体的某些数字特征)的取值情况。因此需要用样本提供的信息估计这些参数,这就是所谓的参数估计问题。
样本及抽样分布
一 总体和样本
总体和样本是贯穿于统计推断过程的两个十分重要的概念,在统计实践中,我们必须首先对这两个概念的含义有比较透彻的了解。
通常我们将研究对象的全体称为总体,它由某些具有共同性质或特征的个体或单位组成。例如,我们研究某校学生的英语平均水平,则该校全体学生构成一个总体,每位学生是一个个体。总体可分为有限总体和无限总体。当总体所包含的个体数有限时,我们称它是有限总体;当总体所包含的个体数无限时,我们称它是无限总体。对有限总体,一般我们用N来表示总体所包含的个体总数。
任何一个总体都可以用一个随机变量来描述。例如,我们研究某校学生的英语平均水平时,我们关心的是这些学生英语成绩的分布情况,设X表示“任一学生的英语成绩”,则X为某个可能值是有一定概率的,这就是说总体的取值是有其概率分布的,因而总体是一个随机变量。我们对总体的研究就是对相应的随机变量的研究。今后我们凡提到总体就是指一个相应的随机变量,总体的分布函数和数字特征,就是指这个随机变量的分布函数和数字特征。今后我们将不再区分总体和相应的随机变量,一律用大写字母X,Y,Z,…来表示。
为了研究总体的各种性质(如分布函数、数字特征等),我们不可能将所有个体都一一进行研究。事实上,当总体所包含的个体数无限时,这不可能做到,即使总体所包含的个体数有限时也很难做到。例如,研究灯泡的寿命时,由于寿命试验是破坏性的,一旦将每个灯泡的寿命测试完毕,那么这批灯泡也就全报废了。因此要研究总体的各种性质,一般来说必须对总体进行抽样观察,从总体X中随机地抽取n个个体X1,X2,…,Xn,或对总体X进行n次观察,这样取得的(X1,X2,…,Xn)称为总体X的一个样本,样本中所包含的个体数n称为样本容量。对样本(X1,X2,…,Xn)一经测试或观察完毕,就得到一组实数(x1,x 2,…,x n),称其为样本观察值。统计推断的任务就是根据样本观察值(x1,x 2,…,x n)来估计总体X的分布情况。为了使样本观察值尽可能具有代表性,就要求X1,X2,…,Xn相互独立且与总体X具有相同的分布。具有独立同分布特点的样本叫做简单随机样本。今后如果不做特殊声明,所说的样本都是指简单随机样本。
显然样本(X1,X2,…,Xn)应当看作n维随机变量,它也应有自己的分布,由于X1,X2,…,Xn相互独立且与总体X具有相同的分布,所以,
设:总体X的分布函数为F(x),密度函数为f(x),则(X1,X2,…,Xn)的联合分布函数为
联合密度函数为
二 统计量
如前所述,总体实际上就是一个随机变量X,有一定的概率分布和分布的数字特征。由于总体分布的数字特征往往也就是概率分布函数中的参数(如正态分布的数学期望和方差就是密度函数中的参数μ和σ;二项分布的数学期望和方差就是参数np和npq,泊松分布的数学期望和方差就是密度函数中的参数λ),所以根据样本信息估计总体数字特征就称为参数估计。在进行参数估计时,我们并不是直接用一个个的具体样本值来估计、推测总体参数,而是针对不同问题,构造出样本的某种函数(不包含任何未知参数),利用这些函数来估计总体参数。我们把这种不包含任何未知参数的样本的函数称为统计量。
设(X1,X2,…,Xn)是来自总体X的样本,则常用的统计量有:
样本均值:
样本方差:
样本标准差:
以上统计量的观测值分别为
三 抽样分布
统计量是样本的函数,是随着样本不同而变化的量,由于样本是随机样本,所以统计量也是一个随机变量。既然是随机变量,就有一定的概率分布。我们把样本统计量的分布称为抽样分布。从理论上讲,当总体的分布函数已知时,统计量的分布总可以通过求随机变量的函数的分布而得到,因此抽样分布是确定的。然而,要求出统计量的精确分布,一般来说是困难的。这里只给出来自正态总体的几个常用统计量的分布。
正态总体样本均值的分布
设X1,X2,…,Xn是来自正态总体的样本,则
(1)
(2)
(二)分布
设X1,X2,…,Xn是来自正态总体的样本,则称统计量
所服从的分布是自由度为n的分布(卡方分布),记为。其密度函数为:
的图形如图2-1所示。
图2-1
若X1,X2,…,Xn是来自正态总体的样本,则
3.若X1,X2,…,Xn是来自正态总体的样本,分别是样本均值和样本方差,则相互独立,且。
4.若,且
文档评论(0)