§6.2 经验分布函数和频率直方图.ppt

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
§6.2 经验分布函数和频率直方图

关于经验分布函数,我们要注意一下几点: 经验分布函数是利用样本得到的,而样本是随机向量,所以经验分布函数也是随机的。同一个总体,即使是在相同的样本容量下,不同的样本也会给出不同的经验分布函数; 对于给定的x,Fn(x)是一个随机变量,是事件{Xx}在n重贝努里试验中发生的频率; 给定样本值后,经验分布函数就成为一个普通的跳跃函数,而且恰好是一个离散型随机变量的分布函数,该离散型随机变量的分布列为 Pi=1/n,i=1,2,?,n 例 下表为我国大陆各省、直辖市2001年人均国民生产总值(万元),试做出频率直方图,从中判断数据大概是来自什么样的总体? 解: 最小值为2895,最大值为37382,取a=2894.5,b=37382.5,将区间分成6等分,统计频数计算频率,得下表: * §6.2 经验分布函数和频率直方图 分布函数是随机变量的一个重要特征,既然总体可以用随机变量来表示,而样本又可对总体的信息进行提取。因此,怎样用样本(X1,…,Xn)估计总体X的分布函数F(x)? 任意给定自变量x,则 F(x)=P(Xx). 用事件{Xx)发生的频率作为其估计即可。这就引出了下面所谓经验分布函数的概念。 即 设X1,…,Xn是抽自总体X的一个样本,观察值为x1,…,xn, 次序观测值x(1)≤ …≤x(n),则总体X的经验分布函数定义为 x 一、经验分布函数 x (1) x (2) 例 总体X,样本观察值1,2,2,2,3,3,3,4, 则经验分布函数为 经验分布函数如右图所示: 定理6.2.1(格列汶科定理或Glivenko-Cantelli定理) 设F(x)是总体X的分布函数,Fn(x)是总体X的经验分布函数, 所以,我们有必要研究随着样本的不同经验分布函数会发生什么变化。也就是研究经验分布函数和总体分布函数之间的关系。 二、频率直方图 如果总体X的分布函数F(x)有密度函数p(x),怎样利用样本(X1,X2,…,Xn)来刻画这个密度函数?任意给定x?[a,b),则当[a,b)区间比较短,而且p(u)在[a,b)区间变化不大时,有 再次利用频率近似概率的思想,用Rn(a,b)表示样本(X1,X2,…,Xn)中落在[a,b) 的个数,那么 这就引出了频率直方图。 依次给定m+1个实数t0t1…tm,其中t1-t0=t2-t1=t3-t2=…=tm-tm-1=h0. 令 用fn(x)作为密度函数p(x)的估计,这就是频率直方图法。 (1)找出x(1),x(n),选择适当的ax(1),bx(n).(例如将x(1)缩小半个刻度作为a,将x(n)放大半个刻度作为b)取m-1个分点a=t0…tm=b,得到m个等分区间[ti-1,ti)(i=1,…,m)。ti-1称为第i组的下组界;ti称为第i组的上组界;h=ti-ti-1称为组距或步长。则每个数据都落在其中的一个小区间上。 (2)统计落在每一组上的频数ni=Rn(ti,ti+1) ;计算 fi= ni/nh,i=0,1,…,m-1. (3)以[ti-1,ti)(i=1,…,m)为底,fi为高作矩形,即频率直方图。 设(x1,…,xn)是得到的样本观测值,在实际使用时,我们往往用以下步骤具体给出频率直方图 新疆7913 宁夏5340 青海5735 甘肃4163 陕西5024 西藏5307 云南4866 贵州2895 四川5250 重庆5654 海南7135 广西4668 广东13730 湖南6054 湖北7813 河南5924 山东10465 江西5221 福建12362 安徽5221 浙江14655 江苏12922 上海37382 黑龙江9349 吉林7640 辽宁12041 内蒙古 6463 山西5460 河北8362 天津20154 北京25523 00.032258 1 [31634.5,37382.5) 0 0 0 [25886.5,31634.5) 0.0000112 0.064516 2 [20138.5,25886.5) 00.032258 1 [14390.5,20138.5) 0.0000337 0.193548 6 [8642.5,14390.5) 0.000118 0.677419 21 [2894.5,8642.5) 频率/组距 频率 频数 分组

文档评论(0)

ipbohn97 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档