- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高等数学_概率6.2总体与样本
第七章第一节
总体与样本; 在统计学中,将我们研究对象的全体称为总体,而把组成总体的每个基本单位称为个体.
例如:我们想要研究一家工厂的某种产品的废品率.这种产品的全体就是我们的总体,而每件产品则是个体.; 实际上,我们真正关心的并不是总体或个体的本身,而是其某项数量指标.
比如某家工厂的一种产品的使用寿命这样一项数量指标. 因此,我们应该把总体理解为那些研究对象上的某项数量指标的全体,而直接用一个随机变量X表示。
为了评价一家工厂的某种产品的质量的好坏,通常的做法是从它的全部产品中随机地抽取一些样品,在统计学上称为样本.
同上道理,我们实际是把样本理解为样品上的数量指标.
因此,今后当我们说到总体和样本时,既指研究对象又指它们的某项数量指标.; 研究某地区N个农户的年收人.
在这里,总体既指这N个农户,又指我们关心的数量指标──他们的年收入的N个数字.
如果我们从这N个农户中随机地抽出n个农户作为调查对象,那么,这n个农户以及我们关心的数量指标──他们的年收入这n个数字就是样本.; 用一把尺子去量一个物体的长度.
假定n次测量值为X1, X2 ,? , Xn 显然,在这个问题中,我们把测量值 X1, X2 ,? , Xn看成了样本,但是,总体是什么呢?; 这种类型的总体的例子不胜枚举.
例如:为研究某种安眠药的药效,让n个病人同时服用此药,记录下他们各自服药后的睡眠时间比未服药时延长的小时数.
X1, X2 ,? , Xn这些数字就是样本.
什么是总体呢?
设想让某个地区或某个国家,甚至全世界所有患失眠症的病人都服用此药,他们所增加的睡眠时间的小时数的全体,就是该问题中的总体.; 对一个总体,如果我们用X表示它的数量指标,那么X的值对不同的个体取不同的值.因此,如果我们随机地抽取个体,则X的值也就随着抽取的个体的不同而不同.
所以X是一个随机变量!
既然总体是随机变量X,自然就有其概率分布.我们把X的分布称为总体的分布.
总体的特性是由总体分布来刻画的.
因此,我们常把总体和总体分布视为同义语.; 例l中,若农户年收入以万元计,
假定N户中收入X为以下几种取值:
0.5, 0.8, l, 1.2和1.5.
取这些值的农户个数分别为:n1, n2, n3, n4, n5,(这里n1+n2+n3+n4+n5=N).
则总体X的分布为离散型分布,其分布律为:; 例2中,假定物体的真正长度为? (未知).一般说来测量值X,也就是我们的总体,取?附近值的概率要大一些,而离?愈远的值被取到的概率就小一些.
如果测量过程没有系统性误差,那么X取大于?和小于?的概率也会相等.
在这样的情况下,人们往往认为X服从均值为?的正态分布.
假定其方差为?2,则?2反映了测量的精度.于是,总体X的分布为N(?,?2).
记为X~N(?,?2).; 这里有一个问题,即物体长度的测量值总是在它的真正长度?的附近,它根本不可能取到负值.
而正态变量取值在(-∞,+∞)上,那么怎么可以认为测量值X服从正态分布呢?
回答这个问题,有两方面的理由.; 比如,假定物体长度?=10厘米,测量误差约为0.01厘米,则?2=0.012.
这时(?-3?,?+3?)=(9.9997, 10.0003).
于是测量值落在这个区间之外的概率最多只有0.003,可以忽略不计.
可见,用正态分布N(10, 0.012)去描述测量值X是适当的.完全可以认为它根本不可能取到负值.
(2) 另外,正态分布取值范围是无限区间(-∞,+∞),这样还可以解决规定测量值取值范围上的困难.; 如若不然,我们需要用一个定义在有限区间(a, b)取值的随机变量来描述测量值X.那么a和b到底应取什么值,测量者事先很难确定.
再退一步,即使我们能够确定出a和b,却仍很难找出一个定义在(a, b)上的非均匀分布能够用来恰当地描述测量值.
与其这样,还不如我们干脆就把取值区间放大到(-∞,+∞),并采用正态分布去描述测量值.这样既简化了问题又不致引起较大的误差.; 如果总体所包含的个体数量是有限的,则称该总体为有限总体.
有限总体的分布显然是离散型的,如例3.
如果总体所包含的个体数量是无限的,则称该总体为无限总体.
无限总体的分布可以是连续型的,如例4,也可以是离散型
文档评论(0)