- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 总体均数的估计 * * 景学安 [学习要求] 了解:置信区间的正确使用。 熟悉:定量资料抽样研究的特点。 掌握:均数抽样误差和标准误的概念、计算公式和应用;t分布和z分布的概念、特征和两者的联系与区别;总体均数置信区间的概念和计算公式;标准差的标准误的区别和联系。 第一节 均数的抽样误差与标准误 一、样本均数的抽样分布 在医学科学研究中,往往采取抽样研究(sampling study)的方法,即从研究的总体中随机抽取部分观察单位作为样本,然后根据样本信息来推论总体特征,即为统计推断(statistical inference)。然而,由于总体的变量值存在变异,样本均数 往往不等于总体均数 。如表6.1。 ┊ 样本1 样本2 样本3 样本k 定量资料抽样研究的特点 : 1.从同一正态总体 中抽取样本含量n相等的许多样本,这些样本均数的分布仍是以总体均数为中心呈正态分布;或者虽然总体呈偏态分布, 但样本含量足够大时,样本均数的分布仍近似正态分布。见图6.1和图6.3 2.理论上 ,如表6.1,μ=4.5, 。 3.样本均数间的变异小于原始变量的变异,即 , 并随样本含量的增加,样本均数间的变异逐步缩小。见图6.1。如表6.1资料,σ=0.2, =0.041。 4.来自正态总体的样本均数的分布为正态分布N( )。 范围内包含95%的样本均数 范围内包含99%的样本均数 如表6.1资料, 实际范围内包含了96个样本均数,占96%。 二、均数的标准误 由于随机抽样引起的样本均数与总体均数之间以及样本均数之间的差异称为均数的抽样误差(sampling error of mean)。样本均数的标准差称为均数的标准误(standard error of mean, SEM),用符号 表示,它反映了各样本均数 围绕总体均数μ的离散程度,也用来表示样本均数的抽样误差的大小。 1.均数标准误的计算 数理统计已经证明:均数标准误的大小与总体标准差成正比,而与样本含量的平方根成反比, 即 如表6.1资料,σ=0.2,n=20,即 实际工作中总体标准差σ往往是不知道的,而只知道样本标准差S,所以只能用S代替σ, 求得标准误的估计值 , 即: 例6.1 随机抽取某地正常成年男性200名,测得其血清胆固醇的均数为3.64mmmol/L,标准差为1.2mmol/L,试估计其均数的标准误。 2.均数标准误的应用 ⑴表示抽样误差的大小,从而说明样本均数的可靠性。 ⑵ 进行总体均数的区间估计。 ⑶进行均数的t检验。 第二节 t分布 一、t 分布的概念 上一章已说明,正态变量X采用z=(X-μ)/σ变换,则一般的正态分布N (μ,σ)即变换为标准正态分布N (0,1)。又因从正态总体抽取的样本均数服从正态分布N(μ, ),同样可作正态变量的z变换,即 而实际工作中由于σ未知, 也未知,故往往是用 作为 的估计值, 此时对 采用的不是z变换而是t变换了,即 t值有大有小,有正有负,其频数分布是一种连续性分布,这就是统计上著名的t分布(t-distribution)。t分布于1908年由英国统计学家W.S.Gosset以“Student”笔名发表,故又称Student t 分布(Students’ t-distribution)。 ,ν=n-1 二、t分布曲线的特征 图6.4 自由度为1、5、∞时的t分布曲线 由图6.4可见:①t分布曲线是单峰分布,以0为中心,左右两侧对称;②曲线的中间比标准正态曲线(z分布曲线)低,两侧翘得比标准正态曲线略高;③当样本含量越小(严格地说是自由度ν=n-1越小),t分布与z分布差别越大;当ν逐渐增大时,t分布逐渐逼近于z分布,当ν=∞时,t分布就完全成为z分布。所以t分布曲线是随自由度的变动而变化的一簇曲线。 三、t 界值 我们常把自由度为ν的t分布曲线下双侧尾部合计面积或单侧尾部面积为指定概率α时,则横轴上相应的t界值分别记为 或 。如当ν=20,双侧α=0.05时,记为t0.05/2, 20;当ν=22,单侧α=0.01时,记为t0.01, 22。对于 或 值,可根据ν和α值,查附表3
文档评论(0)