第五章 统计量及其分布.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章 统计量及其分布.ppt

第五章 统计量及其分布 §5.2 样本数据的整理与显示 5.2.1 经验分布函数 设 X1, X2, …, Xn 是总体X中的样本是取自 总体分布函数为F(x)的样本,若将样本观测值 由小到大进行排列,为 x(1), x(2), …, x(n),则称 x(1), x(2), …, x(n) 为有序样本,定义如下函数: 则Fn(x)是一非减右连续函数,且满足 Fn(??) = 0 和 Fn(??) = 1 由此可见,Fn(x)是一个分布函数,并称 Fn(x)为经验分布函数。 例5.2.1 某食品厂生产听装饮料,现从生产线 上随机抽取5听饮料,称得其净重(单位:克) 347 355 344 351 这是一个容量为5的样 本,经排序可得有序样本: 其经验分布函数为 定理5.2.1(格里纹科定理) 设x1,x2,…,xn是取自总体分布函数为F(x)的样本, Fn(x) 是其经验分布函数,当n??时,有 P?sup?Fn(x) ? F(x)??0? = 1 格里纹科定理表明: 当n 相当大时,经验分布函数是总体分布 函数F(x)的一个良好的近似。经典的统计学中 一切统计推断都以样本为依据,其理由就在于 此。 5.2.2 频数--频率分布表 样本数据的整理是统计研究的基础,整理 数据的最常用方法之一是给出其频数分布表或 频率分布表。 例5.2.2 为研究某厂工人生产某种产品的能力, 我们随机调查了20位工人某天生产的该种产品 的数量,数据如下 对这20个数据(样本)进行整理,具体步骤 如下: (1)对样本进行分组:作为一般性的原 则,组数通常在5~20个,对容量较小的样本; (2) 确定每组组距:近似公式为 组距d = (最大观测值 ? 最小观测值)/组数; (3) 确定每组组限: 各组区间端点为a0, a1=a0+d, a2=a0+2d, …, ak=a0+kd, 形成如下的分组区间 (a0 , a1] , (a1, a2], …, (ak-1 , ak]其中a0 略小于最小观测值, ak 略大于 最大观测值. (4)统计样本数据落入每个区间的个数—— 频数,并列出其频数频率分布表。 表5.2.1 例5.2.2 的频数频率分布表 5.2.3 样本数据的图形显示 一、直方图 直方图是频数分布的图形表示,它的横 坐标表示所关心变量的取值区间,纵坐标有 三种表示方法:频数,频率,最准确的是频 率/组距,它可使得诸长条矩形面积和为1。 凡此三种直方图的差别仅在于纵轴刻度的选 择,直方图本身并无变化。 二、茎叶图 把每一个数值分为两部分,前面一部分 (百位和十位)称为茎,后面部分(个位) 称为叶,然后画一条竖线,在竖线的左侧写 上茎,右侧写上叶,就形成了茎叶图。如: 数值 分开 茎 和 叶 112 ? 11 | 2 ? 11 和 2 例5.2.3 某公司对应聘人员进行能力测试测 试成绩总分为 150分。下面是50位应聘人员 的测试成绩(已经过排序): 图5.2.3  测试成绩的茎叶图 §5.5 充分统计量 5.5.1 充分性的概念 例5.5.1 为研究某个运动员的打靶命中率,我 们对该运动员进行测试,观测其10次,发现除 第三、六次未命中外,其余8次都命中。这样的 观测结果包含了两种信息: (1) 打靶10次命中8次; (2) 2次不命中分别出现在第3次和第6次打 靶上。 第二种信息对了解该运动员的命中率是没 有什么帮助的。一般地,设我们对该运动员进 行n 次观测,得到 x1, x2,…, xn,每个xj 取值非 0即1,命中1,不命中为0。令 T = x1+…+xn , T为观测到的命中次数。在这种场合仅仅记录 使用T 不会丢失任何与命中率 ? 有关的信息, 统计上将这种“样本加工不损失信息”称为“充 分性”。 样本 x=(x1,x2,…,xn) 有一个样本分布F?(x), 这个分布包含了样本中一切有关?的信息。统 计量T =T (x1,x2,…,xn) 也有一个抽样分布?T(t) , 当我们期望用统计量T 代替原始样本并且不损 失任何有关 ? 的信息时

文档评论(0)

guan_son + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档