第4章 抽样误差与假设检验、t检验.ppt

  1. 1、本文档共71页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4章抽样误差与假设检验、t检验重点讲义

几个概念: 计量资料:测定每个观察单位某项指标量的大小得到的数据(资料)。 总体:研究对象(某项变量值)的全体。 样本:总体中随机抽取的一部分研究对象的某项变量值。 统计量:从样本计算出来的统计指标。 参数:总体的统计指标叫总体参数。 统计推断:用样本信息推论总体特征的过程。 包括: 参数估计: 运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。 假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。 方法:均数的参数估计、均数t 检验 一、抽样误差与标准误 (一)概念 1、抽样误差:是伴随抽样所产生的样本统计量与参数之间的差别。 2、标准误 :符号 ,表示抽样误差大小的指标;也称为样本均数的标准差;反映了用样本均数代替总体均数的可靠性程度的大小,增加样本容量可以降低抽样误差。 (二)、表达式与计算 标准差与标准误联系与区别 二、抽样分布 从正态总体中抽样,样本均数( )的抽样分布: 1. n较大时(n50), 服从正态分布,经过标准化转换 服从标准正态分布即 u分布 2. n较小时(n50), 是非正态的单峰对称分布 就有小样本统计量( )的转换值服从t分布 (是一组曲线)。 英国统计学家:哥塞德在1908年以笔名“student”提出了著名的t分布,故也称为student t分布。 t分布是描述小样本均值转换度的分布。 (1)t→u (n→∞) (2)和N(0, 1)一样都是单峰分布,以0为中心对称 (3) 越小,则 越大,t值越分散,和N(0, 1)相比,集中在这部分的比例越少,尾部翘得越高。 t 分布(与u 分布 比较的特点) 横坐标为自由度 ,纵坐标为概率p,表中数字表示自由度为 、p为 、t的界值,记 如单侧 =0.05, =20可查得 =1.725 表示p(t≥1.725)=0.05 由t分布的对称性p(t≤-1.725)=0.05 tα,ν以外尾部面积的百分数是 与u分布比较 U的临界值小于t曲线相应的临界值的绝对值 当n→∞时,临界值相近。 自由度越小,t的临界点越偏离u的临界点。 总体均数的参数估计 参数估计:是指由样本指标值(统计量)估计总体指标值(参数),即用样本均数估计总体均数,有两种估计方法: (1)、点估计(近似值) (2)、区间估计(近似范围) 一、点估计 点估计: 用样本均数直接作为总体均数的估计值,未考虑抽样误差。 如用 估计相应的μ 当 时,样本均值趋近于总体均值. 如果 ,则 更可靠. 二、区间估计 1、概念 可信区间:也称为置信区间(confidence interval,CI),是按预先给定的概率估计未知总体均数的可能范围. 事先给定的概率1-α称为可信度,常取95%或99% 总体均数的95%(或99%)可信区间:表示该区间包括总体均数μ的概率为95%(或99%). 根据总体标准差σ是否已知,以及样本含量n的大小而异。 (1)t分布法(n50) (2)u分布法(n50) (1)t分布法(σ未知,n50) 按t分布原理,可用以下公式进行区间估计: 对上式进行变换,得置信度为1-α的总体均数可信区间的通式为: 习惯将上式写成: 例 某医师测得40名老年慢性支气管炎病人中17-酮类固醇排除量均数为15.9μmol/d,标准差为5.03 μmol/d,试估计该种病人尿17-酮类固醇排除量总体均数的95%可信区间. 本例中:n=40, =5.03, =n-1=39,α取0.05,查t值表 95%的可信区间 (2)U分布法(σ已知或未知,但n足够大n50) 总体均数的可信区间. σ已知: σ未知但n足够大: uα可以查表 某地12岁男孩身高均数的95%的可信区间. 本例中:n=100, =139.6,s=6.85,u0.05=1.96 该地12岁男孩身高均数的95%可信区间为: 138.3(cm)~141.0(cm) 注意 (1)统计意义:从总体中作大数次随机抽样,有95%求得的可信区间包含总体均数。并不是做一次抽样求得可信区间包括μ的概率是0.95,对一次抽样

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档