- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 抽样分布
前五章中我们讲述了概率论的基本内容,从现在开始将学习数理统计.数理统计以概率论为理论基础,研究如何进行观测及如何根据观测得到的数据,对被研究的随机现象的概率特征作出合理的估计和推断.
数理统计不仅内容丰富,应用亦相当广泛,本书只介绍抽样分布、参数估计及假设检验等部分内容.
本章将从数理统计的基本概念开始,介绍总体、样本、统计量、抽样分布及有关的重要定理.
§6.1 总体与样本
一、总体与样本
在数理统计中,通常把被研究的对象的全体称为总体(或母体)。而把组成总体的每个单元,即每一个研究对象称作个体.从总体中随机抽取的个个体组成的集合称为容量为的样本(或子样).
总体所含个体的数量,称为总体容量,当总体容量为有限时,称为有限总体,否则为无限总体.例如,一个国家的人口构成一个总体,而这个国家中的每一个人为个体;又如工厂在某月生产的显象管是一个总体,而每个显象管则为个体;某地区在一个季度内每天的日平均气温的全体是一个总体,而其中某天的日平均气温为个体.我们在对某个总体进行研究时,所关心的并非是每个个体的一些具体属性(如某个人的年龄或某件产品的好坏).而是要通过若干个个体的某些数量指标,来估计和推断总体的某些特性(如一个国家人口的平均寿命、整批产品的质量等).例如,要分析一批灯泡的质量,通常是以其寿命的长短为标准,若将总体指标(灯泡的寿命)记为,则为随机变量.如果规定寿命低于1000小时为次品,那么我们所关心的次品率问题,也就归结为对随机变量的分布函数及其主要数字特征的研究.
从总体中抽取一个个体,就是对代表总体的随机变量进行一次试验(观测).从总体中抽取个个体,就是对随机变量进行次试验(观测),即得到一个容量为的样本,把这个随机变量看作一个整体,则样本就是元随机变量,记作.当试验结束后,我们就得到一组实数,称其为样本观测值或样本值.
由于我们的任务是从样本推断总体,为了使所抽取的样本具有充分的代表性,从总体中抽取子样必须是随机的,即每个个体被抽到的机会是均等的,同时还要求每次抽取是独立的,即每次抽样结果不影响其它各次抽样结果,也不受其它各次抽样结果的影响,这种抽取方法叫做简单随机抽样.得到的样本称为简单随机样本.那么在具体的运作当中,怎样抽取才能得到简单随机样本呢?如果我们遇到的是无限总体,只要随机抽样即可.如果是有限总体则可采用有放回地重复随机抽样,即每次抽取一个进行观察后放回去,再抽取下一个,重复次便可得到容量为的简单随机样本,这种有放回地重复抽样在使用时很不方便(对一些破坏性试验观察后放回是不可能的),因此当样本容量相对于总体容量很小时,比如不超过总体的5%,也可采用无放回地随机抽样,这样得到的样本,可近似地看作简单随机样本.如不特别声明,今后提到的抽样及样本均指简单随机抽样和简单随机样本.
综上所述,我们给出以下定义
定义6.1设是一个具有分布函数的随机变量,是-组相互独立且与具有相同分布函数的随机变量,则称为来自总体的简单随机样本,简称样本;为样本容量,它们的观测值称为样本值.
由定义得:若为总体的一个样本,则样本的概率分布函数为:
是离散型随机变量,其概率分布为,取有限个或可列个值,则样本取值的概率为:
其中中每一个值都是在所有可能的取值之中.
若是连续型随机变量,概率密度为,则样本的概率密度为:
的样本时,常具有双重意义:有时特指某次抽取的样本值,有时又泛指抽取的随机样本,即一个元随机变量.两者的区别在于,如果是作一般性的讨论,则指随机样本;如果是处理具体问题,则指的是样本值.
二、样本分布
样本既然是随机变量,就有一定的概率分布,这个分布就叫做样本分布.
设总体的分布函数是,从总体中抽取容量为的样本,得到个观测值,把样本中的数据由小到大依次排列,把相同的数合并,并指出其频数,就可写出下面的频率分布表:
观测值 … 频 数 … 频 率 … 其中
,且
定义函数:
称为样本分布函数(或经验分布函数).
的图形就是累积频率曲线,它是非降的阶梯形函数,在处具有跳跃度见图6-1).对任意固定的,是事件“”在次试验中出现的频率。由概率与频率的关系知道,可以作为未知分布函数的一个近似.越大,近似得越好.
例1 从纺织车间抽取10匹布,检查每匹的疵点数得到样本值为(1,0,3,1,1,2,0,1,2,0).写出频率分布及样本分布函数.
将样本的观测值由小到大排列整理后,即可得到频率分布,列表如下:
观测值 0 1 2 3 频 数 3 4 2 1 频 率 样本分布函数为:
其图象如图6-2所示
§6.2 统计量
样本是总体的代表与反映,是对总体进行分析、推断的依据,但在实际应用时,却很少直接利用样本所提供的原始数据进行推断,而
文档评论(0)