- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十五讲 样本及抽样分布
数理统计讨论问题的出发点是试验数据,它的基本任务是研究如何对随机现象进行观察或试验以获得具有代表性的局部数据,以及如何对收集到的局部数据进行整理、分析,并对所研究的对象的整体特性做出尽可能准确的推测和判断.
数理统计的内容十分丰富,大体上可分为收集数据和统计推断两个方面:
(1)收集数据 研究如何对随机现象进行观察或试验,以便获得能够很好地反映整体情况的局部数据.其内容包括抽样技术、试验设计等.
(2)统计推断 研究如何对收集到的局部数据进行整理、分析,并对所考察的对象的整体特性做出尽可能准确可信的推测和判断.其内容包括参数估计、假设检验、方差分析和回归分析等.统计推断是数理统计的主体.
统计推断问题举例:某公司要采购一批产品,每件产品不是合格品就是不合格品,但该批产品总有一个不合格品率 p 。由此,若从该批产品中随机抽取一件,用X表示该产品是否合格,不难看出X服从(0-1),但分布中的参数 p 是不知道的。一些问题:
(1)p 的大小如何;(2)p大概落在什么范围内;(3)能否认为 p 满足设定要求
(如 p 0.05)。
1. 随机样本
总体:试验全部可能的观察值(或研究对象的全体);
个体:每一个可能观察值(或组成总体的每一个元素);
容量:总体中所包含的个体个数;
总体中的每一个个体是随机试验的一个观察值,可理解为它是某一随机变量X的值,研究所有个体的观察值出现的概率,就是研究随机变量X的分布问题。因此,一个总体对应于一个随机变量X。对一个总体的研究就是对一个随机变量X的研究,X的分布函数和数字特征就称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统地称为总体X。
例如,假设一射击手的射击水平稳定,则射击手的所有射击成绩(从前、现在和未来)可称为“总体”,而一次射击的成绩称为“个体”。显然,一次射击的成绩好坏由射击手的射击水平即射击成绩这一随机变量的分布决定,而射击手成绩的“总体”服从同一随机变量分布。
在数理统计中,人们都是通过从总体中抽取一部分个体,根据获得的数据来对总体的分布得出推断的。被抽出的部分个体叫做总体的一个样本。
样本:从总体中抽取的部分个体;
样品:样本中的每个个体;
样本容量:一个样本中所含样品的个数。
为对总体分布得出合理的推断,人们常采用简单随机样本进行分析。
简单随机样本:设是来自总体 X 的一个样本,若相互独立,且都与X 有相同的概率分布,则称为总体 X 的一个简单随机样本,简称样本。
也可以将样本看称是一个随机向量,写成。
由定义得,若为具有分布函数的总体X的一个样本,则相互独立,且它们的分布函数都是,所以的联合分布函数为
又若X具有概率密度,则的概率密度为
.
2. 统计量
样本是进行统计推断的依据。在应用时,往往不是直接使用样本本身,而是针对不同的问题构造样本的适当函数,利用这些函数进行统计推断。
定义:设X1,X2,...,Xn是来自总体X的一个样本, g(X1,X2,...,Xn)是X1,X2,...,Xn的函数, 若g中不含未知参数, 则称g(X1,X2,...,Xn) 是一统计量。
常用的统计量:
设是来自总体 X 的容量为的样本,称统计量
(1)为样本均值;
(2)为样本方差;
为样本标准差;
(3)为样本的k阶(原点)矩;
(4)为样本的k 阶中心矩。
样本方差的计算式:
3. 经验分布函数
设是总体F的一个样本 用S(x)表示中不大于x的随机变量的个数, ,定义经验分布函数Fn(x)为
一般, 设是总体F的一个容量为n的样本值. 先将按自小到大的次序排列, 并重新编号, 设为
,
则经验分布函数Fn(x)的观察值为
例如 (1)设总体F具有一个样本值1,2,3, 则经验分布函数F3(x)的观察值为
(2)设总体F具有一个样本值1,1,2, 则经验分布函数F3(x)的观察值为
对于经验分布函数Fn(x), 格里汶科(Glivenko)在1933年证明了以下的结果: 对于任一实数x, 当时Fn(x)以概率1一致收敛于分布函数F(x), 即
因此, 对于任一实数x,当n充分大时, 经验分布函数的任一个观察值Fn(x)与总体分布函数F(x)只有微小的差别, 从而在实际上可以当作F(x)来使用. 第六章 样本及抽样分布
概率论和数理统计都是研究随机现象统计规律性的学科,但是它们在研究问题的方法上又有其自身的特点.在许多实际问题中,要想全面地了解所研究的对象的整体情况往往是不现实的,只能通过试验得到它的局部信息,由于局部和整体是密切相联系的,还是可以利用这局部信息来推断整体特性的,这就是数理统计方法的基本思想.
§1 随机样本
当总体的容量有限时,称为有限总体;否则,称为无限总体.
应当指出,样本是具有二重性的.一方面,抽样
文档评论(0)