统计学第3章概率分布与抽样分布.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学第3章概率分布与抽样分布统计学第3章概率分布与抽样分布

分层抽样 (stratified sampling) 将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本 优点 保证样本的结构与总体的结构比较相近,从而提高估计的精度 组织实施调查更方便 既可以对总体参数进行估计,也可以对各层的目标量进行估计 分层或分类时,应使层内各单位的差异尽可能小,而使各层之间的差异尽可能大。 * 系统抽样 (systematic sampling) 将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位 先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位 优点:操作简便,可提高估计的精度 缺点:对估计量方差的估计比较困难 也称等距抽样或机械抽样 * 例3-1:从10000户中抽取200户进行抽样调查。 ①把10000户按一定标志(如家庭人口、收入水平、地址等)排列编号1—10000号; ②求出抽样间隔k=N/n=10000/200=50 ③在第一个间隔1--50号内任意选取一个单位作为抽样起点,如38号; ④从38号开始,每隔50户抽取一户 38、88、138、188……9988,共200户。 系统抽样 (例题) * 整群抽样 (cluster sampling) 将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查 特点 抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用,方便调查的实施 缺点是估计的精度较差 * 3.4 抽样分布 3.4.1 抽样分布的概念 3.4.2 样本均值抽样分布的形式 3.4.3 样本均值抽样分布的特征 3.4.4 样本比率的抽样分布 3.4.5 样本方差的抽样分布 * 研究总体与所抽取的样本之间的关系是统计学的中心内容 。对这种关系的研究从两方面着手: 一是从总体到样本 ,这就是研究抽样分布(sampling distribution)的问题; 二是从样本到总体,这就是统计推断(statistical inference)问题。 抽样分布 (sampling distribution) * 抽样分布 (sampling distribution) 从一个给定的总体中抽取(不论是否有放回)容量(或大小)为n的所有可能的样本, 对于每一个样本,计算出某个统计量(如样本均值或标准差)的值,不同的样本得到的该统计量的值是不一样的,由此得到这个统计量的概率分布,称之为抽样分布。 样本统计量与总体参数之间的差异称为抽样误差 (sampling error)。 * 样本统计量的概率分布,是一种理论分布 在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 随机变量是样本统计量 样本均值, 样本比例,样本方差等 结果来自容量相同的所有可能样本 提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布 (sampling distribution) * 抽样分布 (例题分析) 某班组5个工人的日工资为34、38、42、46、50元。 ? = 42 ?2 = 32 现用重置抽样的方法从5人中随机抽2个构成样本。共有52=25个样本。如右图。 总体单位数很大时,难以一一列举样本数,可通过反复进行抽样,记录下统计量取不同数值时的次数百分比,以得到一个统计量近似的抽样分布 * 设有一个总体 ,总体平均数为 μ,方差为σ2,总体中各变数为 x, 将 此总体称为原总体。现从这个总体中随机抽取含量为n的样本,样本平均数记为 。 可以设想,从原总体中可抽出很多甚至无穷多个含量为n的样本。由这些样本算得的平均数有大有小,不尽相同,与原总体平均数μ相比往往表现出不同程度的差异,即抽样误差(sampling error)。 (一)样本均值的抽样分布 * 样本均值的抽样分布 (例题分析) 【例】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总体分布、总体的均值、方差及分布如下 总体分布 1 4 2 3 0 .1 .2 .3 * 样本均值的抽样分布 (例题分析) ? 现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为 3,4 3,3 3,2 3,1 3 2,4 2,3 2,2 2,1 2 4,4 4,3 4,2 4,1 4 1,4 4 1,3 3 2 1 1,2 1,1 1 第二个观察值 第一个 观察值 所有

文档评论(0)

cxiongxchunj + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档