抽样与抽样分布课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4 统计抽样与抽样分布 抽样的基本概念 抽样方法 抽样分布的概念 样本均值的抽样分布 本章的学习目的 本章的学习目的是为了认识到通过样本推断总体的科学性。 当总体元素非常多,或者检查具有破坏性时,需要进行抽样。抽样的目的是为了推断总体的数量特征,但这种推断必定伴有某种程度的不确定性,需要用概率来表示其可靠程度,这是推断统计的重要特点。 案例 1936年美国总统选举的预测,民主党罗斯福VS共和党兰登。《文摘》邮寄了1000万份调查表;收回240万份,预测兰登获得57%的选票获胜。而盖洛普研究所仅仅随机抽取了2000 多选民,预测罗斯福将得到54%的选票获胜。 选举结果是罗斯福获得62%的选票获胜。 此后,盖洛普研究所每年用1000~1500人的样本快速准确的预测选举,误差在2%之内。 抽样的基本概念 抽样调查,按照随机原则从全部研究对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。 随机原则:指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会。 随机原则的实现 抽签法,是将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。 随机数表法:将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位。 计算机模拟法:是将随机数字编制为程序存储在计算机中,需要时将总体中各单位编上号码,启用随机数字发生器输出随机数字。 抽样的基本概念 总体,要研究的调查对象的全体。 个体,组成总体的每个元素。 样本:从总体中随机抽取的部分个体。 样本容量:样本中所含的个体数量。 样本和总体(sample population) 视频教学 抽样的基本概念 抽样误差:用于抽样的随机性所带来的误差,是一种固有误差。 非抽样误差:调查过程中发生的误差,以及由于主观因素破坏了随机性原则而产生的系统性偏差,是可以避免的。 随机抽样设计 不同的抽样方式,对抽样结果有很大影响,根据研究目的和要求,以及具体情况选择抽样方式; 简单随机抽样、等距抽样、类型抽样、整群抽样、多阶段抽样等。 抽样方法-概率抽样 根据已知的概率选取样本 简单随机抽样:完全随机抽取样本; 分层抽样:总体分“层”,在每一层内进行抽样; 整群抽样:将总体划分为若干群,将一组被调查者(群)作为一个抽样单位。(群内的个体存在差异,理想情况是每个群都是总体的一个缩影) 等距抽样:在样本框中,每隔一定距离抽选一个被调查者。 抽样方法-非概率抽样 不是完全按照随机原则选取样本 非随机抽样:由调查人员自由选取被调查者; 判断抽样:通过某些条件过滤来选取被调查者; 抽样分布 在讨论抽样分布之前,需要回顾以下一些与概率分布有关的概念: 随机变量、离散型随机变量及其概率分布、连续型随机变量及其概率分布。 概率密度函数。 随机变量(Random Variable) 随机变量是表征一个随机试验结果的变量,其数值由一次试验结果所决定,但是在试验之前是不确定的。 随机变量的所有可能取值就是所有基本事件对应的值。通常用英文大写字母或希腊字母表示。 离散型、非离散型、连续型。 随机变量(Random Variable) 离散型随机变量:投掷骰子; 非离散型随机变量:某路口24小时内经过的车辆; 连续型随机变量:灯泡寿命。 离散型随机变量 离散型随机变量的取值域由有限个或可数多个数值或符号组成。 其概率是指离散型随机变量(X)取一个具体数值(x)的概率,即P(X= x)。 离散型随机变量的概率分布是指离散型随机变量取遍每一个实验结果x的概率的分布情况,常用列表表示,如下表。 离散型随机变量 连续型随机变量 连续型随机变量的取值域为一个连续区间。 只有在(连续的)区间上取值时,其概率才可能为正值,连续型随机变量在任何一点上的概率都为零。 概率密度函数 最常见的连续型随机变量的概率分布 正态分布(P40)。 最常见的连续型随机变量的概率分布 标准正态分布: 标准正态分布的计算 正态分布的计算 - 例题 某厂生产的某种节能灯管使用寿命服从正态分布,对某批次产品的测试结果,平均使用寿命为1050小时,标准差为200小时。求: 1. 使用寿命在500小时以下的灯管占多大比例? 2. 使用寿命在850~1450小时的灯管所占比例? 3. 以均值为中心,95%的灯管使用寿命的范围? 什么是抽样分布? 如果要估计总体的均值 ;是用样本平均值 ,还是用中位数m? 还是掷骰子,总体均值 第一次,2,2,6,m=2 第二次,3,4,6,m=4, 可见,不能仅仅根据一个样本去比较是 和 m 样本统计量本身是随机变量,抽样分布就是由样本n个观察值

文档评论(0)

boss + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档