- 第四章 总体均数的估计与假设检验.pptVIP

- 第四章 总体均数的估计与假设检验.ppt

  1. 1、本文档共55页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
- 第四章 总体均数的估计与假设检验.ppt

第四章 总体均数的估计与假设检验;抽样误差和标准误 t变换和t分布 均数的可信区间 假设检验的基本原理;统计描述 统计推断 参数估计 假设检验;总体:根据研究目的所确定的性质相同的所有观察单位的某种变量值的集合。 如:调查某地1999年正常成年男子的红细胞数,则观察对象是该地1999年正常成年男子,总体就是该地1999年正常成年男子的血红细胞数。 总体分为: 有限总体(finite population):有确定的时间、空间和观察单位数。 无限总体(infinite population) :没有确定的时间和空间限制,观察单位数为无限。;样本:从总体中随机抽取的部分观察单位的某个变量值所组成的集合。 抽样的目的:用样本信息来推断总体特征,要保证样本的可靠性和代表性,使样本能够充分地反映总体的真实情况。这就要求严格遵循随机化的原则,并保证足够的样本含量。;由于抽样而造成的样本统计量和总体参数之差称为抽样误差(sampling error)。 由于抽样而造成的样本均数和总体均数之差称为均数抽样误差,抽样误差是抽样研究固有的特点,是不可避免的。 抽样误差的分布有一定的规律性,并且可以通过一定的方法来估计。;N(μ,?2); 是样本均数的标准差称为均数标准误(简称标准误),它反映了样本均数与总体均数之间的接近程度,常用以说明均数抽样误差的大小。 标准误的计算: ;在实际工作中,总体标准差?常是未知的而是用样本标准差s来代替?, 的估计值记作 。 例:某地成年男子红细胞数的抽样调查, n=144人, =5.38×1012/L,s =0.44×1012/L,求其标准误。 ; 标准误是反映样本均数变异程度的指标,常用来表示抽样误差的大小。标准误大反映样本均数抽样误差大,其对总体均数的代表性差;标准误小,样本均数抽样误差就小,其对总体均数的代表性就好。 标准误可用于计算总体均数的可信区间,也是进行假设检验的基础。 ;标准差和标准误的区别; 标准差随着样本量的增多,逐渐趋于稳定。 标准误随着样本量的增多而减小,如均数的标准误,当标准差不变时,与样本量的平方根呈反比。 当样本含量趋近于总体例数时,则样本标准差趋于稳定,近似等于总体标准差;标准误则趋近于0,抽样误差几乎消失。;例:某年龄段正常成年女性的体重服从 N(51,52)(单位为kg),从该总体中随机抽取例数n为50的样本。 从总体中随机抽取例数n为300的样本。 ;;;在总体均数为?,标准差为?的正态总体中,独立随机的抽取样本含量为n的样本,则样本均数服从正态分布 : 将样本均数标准化,则: 其中的分母称为均数的标准误,如果变量是正态的或近似正态的,则标准化的变量服从或近似服从N(0,1)分布,即u分布。;若上式中的?是未知的,可用样本标准差s代替总体标准差?,此时采用的不是u变换而是t变换了,即: 其结果就不再服从标准正态分布了,而是服从自由度为n-1的t分布。 ;t-分布曲线;t 分布与u分布相比有以下特征: 都是单峰分布,以0为中心,左右两侧对称。 t分布的峰部较矮而尾部翘得较高,说明远侧t 值的个数相对较多,即尾部面积较大。自由度越小这种情况越明显。 t分布不是一条曲线,而是由一簇随自由度改变而变化的曲线所组成。 自由度是t分布的参数。当?逐渐增大时,t分布逐渐逼近u分布;当 ?=? 时,t分布就完全成为u分布了。;已将各种自由度对应的t分布曲线下的尾部面积(概率)的百分界值编制成t界值表。 由于t分布是以0为中心的对称分布,故表中只列出正值,所以查表时,不管t 值正负只用绝对值。 表右上角插图中阴影部分,表示tα,ν以外尾部面积占总面积的百分数,即概率P。;随着自由度?的增大,t界值逐渐减小,当自由度无穷大时,双侧t0.05=1.96,单侧t0.05,=1.645,即为u分布的界值。故常用自由度无穷大时的t界值作为u界值来用。 如由表查出单侧t0.05,10=1.812,表示从正态总体作样本例数为11的随机抽样,其t值服从?=n-1=11-1=10的t分布,理论上 P(t≤-1.812)=0.05,或P(t≥1.812)=0.05;用更一般的表示法为 单侧:P(t≤-tα,ν)=α,或P(t≥tα,ν)=α 双侧:P(t≤-tα/2,ν)+P(t≥tα/2,ν)=α 反之 P(-tα/2,νttα/2,ν)=1-α ; 参数估计是通过样本指标(统计量)来估计总体指标(参数)。它包括两种方法: 点(值)估计(point estimation):即把样本统计量直接作为总体参数的估计值,如用样本均数来估计总体均数。这种方法虽然很简单,但是未涉及随机误差,而随机误差在抽样研究中是不可

文档评论(0)

zhangningclb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档