网站大量收购独家精品文档,联系QQ:2885784924

概率第7章节样本分布090511下.pptVIP

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
概率第7章节样本分布090511下

* * * * 第七章 样本分布    —— 组成总体的每一个元素即总体的每个数量指标,可以看作随机变量 X 的某个取值。    研究对象全体元素组成的集合所研究的对象的某个(或某些)数量指标的全体,   X 的分布函数和数字特征称为总体的分布函数和数字特征. 一.总体和样本 总体—— 个体 例如:一批灯泡,全体灯泡的使用寿命就是总体,每个灯泡的使用寿命是个体. 它是一个随机变量(或多维随机变量).记为X . 样本 —— 从总体中抽取的部分个体.   称 为总体 X 的一个容量为n 的样本观测值,或称样本的一个实现. 用 表示样本, n 称为样本容量. 样本空间 —— 样本所有可能取值的集合. 在进行抽样时,样本的选取是随机的,即总体中每个 实际中,如总体样数很大,而抽取的样本容量相对小, 简单随机样本:进行重复抽样所得的随机样本. 个体都有同等机会被选入样本。抽样通常有两种方式: 一种是不重复抽样,另一种是重复抽样。 如果总体单位数是无限的,抽取有限个不影响总体的 分布(此时重复抽取与不重复抽取没有多大区别)。 即可认为总体为无限的. .(现在我们只研究简单随机样本) 简单随机样本具有以下两个性质: (2)代表性:即 中的每一个都与 (1)独立性:即 中,各个随机变量 的取值互不影响,这时,我们称 是相互 独立的随机变量. 总体 有相同的概率分布. 相同分布的随机变量离散型的具有相同的概率分布律 连续型的具有相同的概率密度,所以期望与方差全相同 样本容量为n的样本是n个相互独立且与总体有相同分布 记为 的随机变量 (n为样本容量), 是n元随机变量 的一个样本观测值, 记为 构成的一个n元随机 变量, 一个容量为n的样本--------- (1)指一个n元随机变量。 从这个角度来说, (2)指某一次抽样的具体数值。 从这个角度来说, 统计量定义: 为统计量,其中 不含未知参数 都是统计量 3.统计量 的函数 样本 统计量一般是样本 的连续函数,由于 样本 是随机变量,因而它的函数也是随机变量。 如: 二.样本分布函数 在实际统计工作中,数据的处理形式为表和图。 统计表有简单表和分组表;统计图有频数(率)图, 频率直方图和累计频率直方图。 1.分组数据的统计表和频数直方图 简单表就是依出现的先后次序或按其数值大小列成表格, 一般用处不大。 如果数据较多,可分成若干组,按各组数值大小列成表格 或制图 例1. 观察新生女婴儿的体重 (它是一个连续型随机变量) 取170号按顺序测得体重如表7-1. 此表是体重 按出生顺序 排序. 单位为克(g) 分组数据的频数分布表 分组时一般采取等区间分组,区间长度称为组距. 制作分组数据表的步骤: (1)从数据找出最大值M与最小值L,并求出它们的差. 这里:L=1800,M=4280,M-L=2480 (2)决定分组的界限。一般采用包含区域(L,M) 的稍宽区域(a, b)为分组的界限。 这里取:a=1700, b=4300, [L,M] [a, b] (3)决定组距(用D表示)和组数(用k表示),它们之间的关系 为D=(b-a)/k,取组数时常常按照一定的经验法则,一般 来说,决定组数应使每组至少有个4、5个数据,当数据很 多时,只要可以反映分布的趋势,也可以每组很多数据。 这里:取k=13, D =(b-a)/k=(4300-1700)/13=200 其中落到各组的数据个数称为组频数。 例2 将例1中前20个新生婴儿体重按大小顺序列成一简单 统计表,如下表所示。 2 5 8 3 2 组频数 3750 3450 3150 2850 2550 组中值 3600-3900 3300-3600 3000-3300 2700-3000 2400-2700 组限 5 4 3 2 1 分组编号 若进一步把20个数据分成5组(每组不包括上限)。试 给出分组数据的频数分布表。 解: 这里取:a=2400, b=3900 要分5个组, 组距 =(b-a)/5=(3900-2400)/5=300 画频率分布直方图的步骤: 1. 求b-a 3. 将数据分组 5. 画频率分布直方图 4. 列频率分布表 图中小长方体的面积等于对应的频率 各小长方体的面积之和等于1 2.频率直方图和累计频率直方图 组频率:是指组频数与样本容量的比值。 累积频率

文档评论(0)

junjun37473 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档