Chapter 4 抽样推断 统计学上课教材.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Chapter 4 抽样推断 统计学上课教材.ppt

Chapter 4 抽样推断 (Statistical inference);有关表达的含义;;;;第1节 抽样分布;1.1 三种不同性质的分布;总体中各元素的观察值所形成的分布 分布通常是未知的 可以假定它服从某种分布 ;一个样本中各观察值的分布 也称经验分布 当样本容量 n 逐渐增大时,样本分布逐渐接近总体的分布 ;样本统计量的概率分布 是一种理论概率分布 随机变量是 样本统计量 样本均值, 样本比例,样本方差等 结果来自容量相同的所有可能样本 提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 ; 抽 样 分 布 (sampling distribution);;;1.2 抽样分布的性质; 一、样本平均数 的抽样分布的性质;2.正态总体 、总体的方差 未知、小样本:;t 分布;样本平均数的抽样分布;3.总体分布形式未知或非正态分布、大样本:;中心极限定理 (central limit theorem); 中心极限定理 (central limit theorem);抽样分布与总体分布的关系;二、样本成数 p 的抽样分布的性质;1.3 抽样误差;抽样方法;(1) 简单随机抽样;(2) 分层抽样;分层(类)抽样;(3) 等距抽样;等距抽样;(4) 整群抽样;3、整群抽样;(4) 多阶段抽样;2.非概率抽样;1、实际抽样误差 由实际样本计算得到的指标与总体指标的差异。;不过在抽样调查实践中不可能按照上例方法计算全部样本的误差,再计算抽样平均误差。但它可以根据总体方差,样本容量(抽样单位数目)和抽样方式,通过一定公式进行计算。当总体为N,样本容量为n时,抽样平均误差公式为: ;抽样平均误差的实际计算公式;经常地, 未知,用样本方差替代:;影响抽样平均误差的因素; 标准差 对观察值的离散程度的度量; 显示观察值与平均数的接近程度; 可理解为每个观察值与平均数的离差的平均; 可以用于确定总体中大部分观察值所在的范围。 抽样平均误差(标准误:抽样分布的标准差,抽样均值的标准误差) 测量用样本平均数估计总体平均数时的精确程度; 用于估计抽样误差,反映的是样本平均数抽样分布 的离散程度; 显示该样本平均数与总体平均数的接近程度; 用于确定估计的总体平均数的置信区间。 ;3、 抽样??限误差;抽样极限误差Δ是单个样本值与总体指标值之间的绝对离差,而抽样平均误差是所有可能样本值与总体指标值的平均离差,而两者的比值,就使得有单一样本得到的抽样极限误差标准化,通常称这一比值为概率度 t (有的教科书称t为临界值) ;抽样平均数的抽样极限误差;在抽样估计中,人们往往要求:;例1:某灯泡厂在某一时期内大量生产某种型号的灯泡。现采用随机抽样的调查方式,进行质量检查,其结果:;解:由样本资料:;例2、某企业生产一批灯泡,共10 000只,随机抽取500只作耐用实验。测算结果平均使用寿命为5 000小时,样本标准差为300小时,500只中发现10只不合格。求平均数和成数的抽样平均误差。 解 A. 样本平均数的抽样平均误差: 采用重复抽样方法:;B. 样本成数的抽样平均误差:;第二节 参数估计; ——即根据样本指标去估计、推断总体的相应指标。待估计的总体指标叫总体参数。参数估计有点估计和区间估计两种。 ;(1)用于估计总体某一参数的随机变量 如样本均值,样本成数、样本中位数等 例如: 样本均值就是总体均值?的一个估计量 如果样本均值 ?x = 3 ,则 3 就是 ? 的估计值 (2)理论基础是抽样分布; 评价点估计量优劣的准则: ——无偏性 ——有效性 ——一致性 ;无 偏 性;有 效 性;一 致 性;二、区间估计;;1)根据一个样本的观察值给出总体参数的估计范围 2)给出总体参数落在这一区间的概率 3)例如: 总体均值落在50~70之间,置信度为 95%;(1)将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 (2)表示为 (1 - ???? ??为显著性水平,是总体参数未在区间内的概率? (3)常用的置信水平值有 99%, 95%, 90% 相应的 ??为0.01,0.05,0.10;均值的抽样分布;三、两类区间估计; 1)正态总体 ?2已知;解:已知X~N(?,0.152),?x=21.4, n=9, 1-? = 0.95, 查表得:Z?/2=1.96 总体均值?的置信区间为;A.假定条件

您可能关注的文档

文档评论(0)

yuzongxu123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档