概率论与数理统计习题和课件历史上最好的512总体与样本数据整理.pptVIP

  • 32
  • 0
  • 约8.12千字
  • 约 55页
  • 2016-09-28 发布于广东
  • 举报

概率论与数理统计习题和课件历史上最好的512总体与样本数据整理.ppt

概率论与数理统计习题和课件历史上最好的512总体与样本数据整理

令 ,则 当 时, 依概率收敛于总体的分布函数 ,且相互独立。易得 由伯努利大数定律大数定律得 格里汶科定理 例1 解:将数据由小到大排列为 -402=22.5=2.5=2.533.24 样本经验分布 函数为: 。 。 。 。 。 。 。 -4 -3 -2 -1 0 1 2 3 4 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 x 例2 某食品厂生产听装饮料,现从生产线上随机抽取5听饮料,称得其净重为(单位:g) 351 347 355 344 351 这是一个容量为5的样本,经排序可得有序样本: x(1) =344,x(2) =347, x(3) =351, x(4) =351, x(5) =355, 其经验分布函数为 频数频率分布表 样本数据的整理是统计研究的基础,整理数据的最常用方法之一是给出其频数分布表或频率分布表。 为研究某厂工人生产某种产品的能力,我们随机调查了20位工人某天生产的该种产品的数量,数据如下: 160 196 164 148 170 175 178 166 181 162 161 168 166 162 172 156 170 157 162 154 对这20个数据(样本)进行整理,具体步骤如下: 一、对样本进行分组。首先确定组数k,作为一般性的原则,组数通常在5~20个,对容量较小的样本,通常将其分为5组或6组,容量为100左右的样本可分7到10组,容量为200左右的样本可分9到13组,容量为300左右及以上的样本可分12到20组,目的是使用足够的组来表示数据的变异。本例中只有20个数据,我们将之分为5组,即k=5。 本例中,数据最大观测值为196,最小观测值为 148,故组距近似为 ,方 便起见,取组距为10。 二、确定每组组距。每组区间长度可以相同也可 以不同,实用中常选用长度相同的区间以便于进 行比较,此时各组区间的长度称为组距,其近似 公式为: 组距d=(样本最大观测值-样本最小观测值)/组数 三、确定每组组限。各组区间端点为 a0, a0+d=a1, a0+2d=a2,…,a0+kd=ak, 形成如下的分组区间 其中a0 略小于最小观测值, ak略大于最大观测值 本例中a0=147,a5=197,于是本例中的分组区间为: 统计样本数据落入每个区间的个数——频数,并列出其频数频率分布表。 本例的频数频率分布如下,从表中可以读出很多信息,如:40%的工人产量在157到167之间;产量少于167个的有12人,占60%;产量高于177的有3人,占15%。 组序 分组区间 组中值 频数 频率 累计频率% 1 (147,157] 152 4 0.20 20 2 (157,167] 162 8 0.40 60 3 (167,177] 172 5 0.25 85 4 (177,187] 182 2 0.10 95 5 (187,197] 192 1 0.05 100 合计 20 1 样本数据的图形显示 一、直方图 频数分布最常用的图形表示是直方图,它在组距相等场合常用宽度相等的长条矩形表示,矩形的高低表示频数的大小。在图形上,横坐标表示所关系变量的取值区间,纵坐标表示频数,这样就得到频数直方图。若把纵轴改成频率就得到频率直方图。 为使诸长条矩形面积和为1,可将纵轴取为频率/组距,如此得到的直方图称为单位频率直方图,或简称频率直方图。 0 147 157 167 177 187 197 10 9 8 7 6 5 4 3 2 1 x 频数 上述例子的频数直方图 二、茎叶图 除直方图外,另一种常用的方法是茎叶图。 例某公司对应聘人员进行能力测试,测试成绩总分为150分。 下面是50位应聘人

文档评论(0)

1亿VIP精品文档

相关文档