《数理统计知识小结.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数理统计知识小结

数理统计知识小结 ------缪晓丹 20114041056 第五章 统计量及其分布 §5.1总体与样本 总体与样本 在一个统计问题中,把研究对象的全体称为总体,构成总体的每个成员称为个体。对于实际问题,总体中的个体是一些实在的人或物。这样,抛开实际背景,总体就是一堆数,这堆数中有大有小,有的出现机会多,有的出现机会小,因此用一个概率分布去描述和归纳总体是合适的,从这个意义上说: 总体就是一个分布,而其数量指标就是服从这个分布的随机变量。 例5.1.1考察某厂的产品质量,将其产品分为合格品和不合格品,并以0记合格品,以1记不格品,若以p表示不合格品率,则各总体可用一个二点分布表示: X 0 1 p 1-p p 不同的p反映了总体间的差异。 在有些问题中,我们对每一研究对象可能要观测两个或更多个指标,此时可用多维随机向量及其联合分布来描述总体。这种总体称为多维总体。 若总体中的个体数是有限的,此总体称为有限总体;否则称为无限总体。实际中总体中的个体数大多是有限的,当个体数充分大时,将有限总体看作无限总体是一种合理抽象。 二、样本与简单随机样本 1、样本 为了了解总体的分布,从总体中随机地抽取n个个体,记其指标值为 , 则 称为总体的一个样本,n称为样本容量或简称为样本量,样本中的个体称为样品。当时,称为大样本,否则为小样本。 首先指出,样本具有所谓的二重性:一方面,由于样本是从总体中随机抽取的,抽取前无法预知它们的数值,因此样本是随机变量,用大写字母 表示;另一方面,样本在抽取以后经观测就有确定的观测值,因此样本又是一组数值,此时用小写字母 表示。简单起见,无论是样本还是其观测值,本书中均用 表示,从上下文我们能加以区别。 每个样本观测值都能测到一个具体的数值,则称该样本为完全样本,若样本观测值没有具体的数值,只有一个范围,则称这样的样本为分组样本。从而知道分组样本与完全样本相比在信息上总有损失,但在实际中,若样本量特别大,用分组样本既简明扼要,又能帮助人们更好地认识总体。 2、简单随机样本 从总体中抽取样本可有不同的抽法,为了能由样本对总体作出较可靠的推断就希望样本能很好地代表总体。这就需要对抽样方法提出一些要求,最常用的有如下两个要求: 1)样本具有随机性:要求每一个个体都有同等机会被选入样本,这便意味着每一样品 与总体X有相同的分布。 2)样本要求有独立性:要求每一样品的取值不影响其它样品的取值,这便意味着 相互独立。 若样本是n个相互独立的具有同一分布的随机变量,则称该样本为简单随机样本,简称为样本。 注(1)若总体X的分布函数为F(x),则其样本的联合分布函数为 (2)若总体X的密度函数为p(x),则其样本的联合密度为 (3)若总体X的分布列为 ,则其样本的联合分布列为 (4)对有限总体不放回抽样,若总体中有几个个体,抽取样本容量为n,当nN ()时,不放回抽样得到的样本可认为是简单随机样本。 例5.1.5 设有一批产品共N个,需进行抽样检验以了解其不合格品率p,现从中抽出n个逐一检查它们是否是不合格品,记合格品为0,不合格品为1。则总体为一个二点分布:P(X=1)=p,P(X=0)=1-p。设 为该总体的一个样本,采用不放回抽样得到。这时,第二次抽到不合格品的概率依赖于第一次抽到的是否是不合格品: 但当N很大时,上述两个概率近似都等于p,所以当N很大,而n不大时,不放回抽样得到的样本可近似看成简单随机样本。 §5.2样本数据的整理与显示 一、经验分布函数 1、定义 设是取自总体分布函数为F(x)的样本,若将样本观测值从小到大进行排列为,则为有序样本,如下函数 称为经验分布函数。 2、经验分布函数的性质 对每一个固定的x,是事件“”发生的频率,当n固定时,是样本的函数,是一个随机变量,且。 (格里纹科定理)定理5.2.1:设是取自总体分布函数为F(x)的样本,是经验分布函数,有 。 注 此定理表明,当n相当大时,经验分布函数是总体分布函数的一个良好的近似。 二、频数频率分布表 样本数据的整理是统计研究的基础,整理数据的最常用方法之一是给出其频数分布表或频率分布表,其基本步骤是: 1、对样本进行分组:首先确定组数k,作为一般性原则,组数通常在5-20个。对容量较小的样本,通常将其分为5组或6组,容量为100左右的样本可分7到10组,容量在200左右的样本可分9~13组,容量为300左右级以上的样本可分12到20组。 2、确定每组组距:每组组距可以相同也可以不同。但实际中常选用长度相同的区间,以d表示组距。 3、确定每组组限。 4、统计样本数据落

文档评论(0)

wwy463wj + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档