描述性统计分析与探索性统计分析.doc

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE PAGE 12 第一章 描述性统计 我们把对某一个问题的研究对象的全体称为总体,总体就是一个具有确定分布的随机变量.我们统计分析的目的是通过从总体中抽得的样本,对总体分布进行推断,要想较准确的推断出总体的分布,首先要对样本的分布状况有一个基本的了解,这一章就是介绍用以描述样本分布状况的一些常用统计分析方法,这些方法既直观又简单,而且也很实用. 1.1频数分析与图形表示 一、总体X为只取少数个值的离散型随机变量 例1.1.1考察一枚骰子是否均匀,设计实验如下: 独立地掷这枚骰子42次,所得点数纪录如下: 3 2 4 1 5 1 5 3 4 3 5 6 4 2 5 3 1 3 4 1 4 3 1 6 3 3 1 2 4 2 6 3 4 6 6 1 6 2 4 5 2 6 X为掷一枚均匀的骰子一次所得的点数 X 1 2 3 4 5 6 7 6 8 8 6 7 1/6 1/7 4/21 4/21 1/7 1/6 二、当总体X取较多离散值或X为连续取值时 设是总体X的一组样本观测值,具体做法如下: 求出和,取a略小于,b略大于; 将区间[a,b]分成m个小区间(m<n),小区间长度可以不等,分点分别为 a ==b 注意:使每个小区间中都要有一定量的观测值,且观测值不在分点上。 划分区间个数的确定: 区间过少:分布信息混杂,丢失信息. 区间过多:出现很多空区间. 区间划分个数m依赖于样本总数n,理论上有如下两个公式可参考: Moore(1986) : m ≈C,C = 1~3; Sturges(1928) : m ≈1+3.322(lg n); 用表示落在小区间(,]中观测值的个数(频数)并计算频率=(j=1,2,…,m); 在直角坐标系x-o-y的x轴上标出,分别以(,]为底边,以为高作矩形,即得频数条形图。 例1.1.2下表是某大学总数为从352名学生的“普通统计学”考试的成绩中,随机抽取的60位学生的成绩 63 76 83 91 45 81 93 30 72 80 82 83 81 76 67 84 72 58 83 64 93 63 75 99 74 76 95 91 83 61 82 85 83 44 88 72 66 94 68 78 88 71 94 85 82 79 100 90 83 88 84 48 72 80 85 80 87 76 62 96 对上述数据作频数分析并画出条形图。 解 分析 区间个数:n=60 , 用Moore公式计算得C*5.123,这里C=1合适,取区间m = 6 用Sturges公式计算得区间m = 6.907, 取区间m = 6 区间划分 10分一区间 区间 [30,39] [40,49] [50,59] [60,69] [70,79] [80,89] [90,100 频数 1 3 1 8 13 23 11 重新划分 区间 [30,59] [60,68] [69,76] [77,84] [85,92] [90,100 频数 5 7 12 18 10 8 1.2直方图与经验分布函数 我们往往希望通过来自总体的一个样本能对总体X的分布有一个大概的估计,常用的方法是直方图与经验分布函数. 一.直方图 直方图是利用样本所构造的函数来估计总体的分布密度函数. 设是总体X的一组样本观测值,X的分布密度为f.具体做法如1.1中的做法,只是: 在直角坐标系x-o-y的x轴上标出,分别以(,]为底边,/△为高作矩形,△=-(j=1,2,…,m),即得直方图 用直方图来近似总体的分布密度函数的实质是: 用直方图所对应的分段函数 =/△ x∈(,],j=1,2,…,m 来近似总体的分布密度函数f(x). 由于当n充分大时可用X 取(,]的频率=来近似x∈(,]的概率 即 ≈P(X∈(,])(n充分大) 而P(X∈(,])=,即 ≈ 且当m充分大,△较小时,对x∈(,)时 ≈ △ 故有 ≈△即 =/△≈, x∈(,],j=1,2,…,m 例1.2.1做出例1.1.2 区间 [30,59] (59,68] (68,76] (76,84] (84,92] (92,100] △ 29 8 7 7 7 8 5 7 12 18 10 8 0.083 0.117 0.2 0.3 0.167 0.133 /△ 0.003 0.015 0.029 .0.043 0.024 0.017 二.经验分布函数 利用样本所构造的函数来估计

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档