网站大量收购独家精品文档,联系QQ:2885784924

第三章 抽样误差与假设检验PPT.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 抽样误差与假设检验PPT

笃 学    精 业    修 德    厚 生 笃 学    精 业    修 德    厚 生 复 习 1、描述数值型资料的分布用什么方法? 2、如何描述数值型资料的分布特征? 3、描述数值型资料的集中趋势和离散趋势指标有哪些? 4、正态分布的特征 第三章 抽样误差与假设检验 掌握内容: 1.t分布的概念和特征 2.总体均数的区间估计 3.假设检验的基本步骤 4.假设检验的基本原理 5.常用的数值型变量假设检验的方法 熟悉: 1、抽样误差的概念 2、引起抽样误差的原因 3、均数的标准误的计算 4、标准差和标准误的区别 第三章 抽样误差与假设检验 第一节 抽样分布与抽样误差 一.抽样研究 (一)抽样研究的意义 样本 总体 (1) 由于研究对象很多是无限总体,要直接研究总体的情况是不可能的。 (2) 即使对有限总体来说,若包含的观察单位数过多,需要耗费大量的人力、物力和时间,而且也不易组织,难以保证工作的质量。 (3)有的时候,观察的实质就是一种破坏性实验,根本就不允许对总体中的每一个体逐一观察。 为什么要做抽样研究? (二)抽样研究和抽样误差  抽样研究是指从总体中按照随机化的原则,抽取一定数量的个体组成样本进行研究,从而推断总体的研究方法。  在抽样研究中产生的样本统计量与相应的总体参数间的差异,称为抽样误差(sampling error),   (三)、抽样误差的分布 理论上可以证明:若从正态总体 中,反复多次随机抽取样本含量固定为n 的样本,那么这些样本均数 也服从正态分布,即 的总体均数仍为 ,样本均数的标准差为 。 抽样分布 抽样分布示意图     (三)、抽样误差的分布 中心极限定理 当样本含量很大的情况下,无论原始测量变量服从什么分布, 的抽样分布均近似正态。 抽样分布 图 抽样分布示意图 二.均数的抽样误差   如上所述,数理统计研究表明,抽样误差具有一定的规律性,可以用特定的指标来描述。这个指标称为标准误(standard error SE)。   标准误除了反映样本统计量之间的离散程度外,也反映样本统计量与相应总体参数之间的差异,即抽样误差大小。 意义:反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。 与样本量的关系:S 一定,n↑,标准误↓ 标准误的计算公式: 例4.1 在某地随机抽查成年男子140人,计算得红细胞均数4.77×1012/L,标准差0.38 ×1012/L ,试计算均数的标准误。 均数标准误的用途 1.衡量样本均数的可靠性 由于均数标准误越小,均数的抽样误差越小,样本均数就越可靠,代表性越好。 2.估计总体均数的可信区间。 3.用于均数的假设检验。 第二节 t 分布 一.t 分布(t-distribution) (一)Z分布   正态分布(normal distribution) 常将一般的正态变量X通过变换[      ] 转化成标准正态变量Z,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布(standard normal distribution),亦称Z分布。   在正态分布总体中以固定n(如n=10)抽取若干个样本时,样本均数的分布仍服从正态分布     ,即。所以,对样本均数的分布进行Z变换[       ],也可变换为标准正态分布N (0,1)。   由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与Z变换区别,称为t 变换t =    ,统计量t 值的分布称为t 分布。 (二)t分布 t分布有如下特征 1.以0为中心,左右对称的单峰分布; 2.t分布是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线,如图4.1。 图4.1 自由度为1、5、∞的t分布   t分布曲线下的面积与自由度ν有关系。如t 分布曲线下面积为95%或99%的界值不是一个常量,而是随着自由度大小而变化的,分别用   和   表示。 t 分布曲线下面积 第三节 总体均数的估计 统计推断包括两个重要的方面:参数估计和假设检验。 参数估计就是用样本指标(称为统计量,statistic)来估计总体指标(参数,parameter)。参数估计有两种方法:点估计和区间估计。 第三节 总体均数的估计 一、可信区间的概念(Confidence Interval) 区间估计:指按预先给定的概率,计算出一个区间

文档评论(0)

erfg4eg + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档