- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 总体均数的估计 与假设检验 统计推断的目的: 用样本的信息去推论总体。 医学研究中大多数是无限总体, 即使是有限总体,但也经常受各种条件的限制,不可能直接获得总体的信息。 第一节 均数的抽样误差与标准误 抽样误差(sampling error):因各样本包含的个体不同,所得的各个样本统计量(如均数)往往不相等,这种由于个体差异和抽样造成的样本统计量与总体参数的差异,称为抽样误差。 产生抽样误差的原因:个体差异 在抽样研究中,抽样误差是无法避免的; 抽样误差的分布有一定的规律性。 例: 某地14岁健康女生身高的总体均数?为155.4cm,标准差为5.30。若从该地14岁健康女生中随机抽取样本含量n均为10人的样本共100次,计算出每次样本的均数为153.8cm,155.5cm,…… 可计算100个样本均数,得频数分布如下: 计算出这100个样本均数的均数为155.52cm,样本均数的标准差为1.64cm 标准误(standard error) 样本均数的标准差,也称均数的标准误,是反映均数抽样误差大小的指标。均数标准误越小,说明样本均数与总体均数的差异程度越小,用该样本均数估计总体均数越可靠。 标准误的计算 标准误的计算 例 某地随机抽查14岁健康女生10人,得身高均数154.8cm,标准差5.40cm,计算标准误。 标准误的用途: 衡量样本均数的可靠性 估计总体均数的置信区间 用于均数的假设检验 数理统计推理和中心极限定理 从正态总体中,随机抽取例数为n的样本,样本均数服从正态分布; 从偏态总体随机抽样,当n足够大时,样本均数服也近似服从正态分布分布; 从均数为μ,标准差为σ的正态或偏态总体,抽取例数为n的样本,样本均数的总体均数= μ,标准差 。 第二节 t 分布 t 分 布的概念 t分布的图形、性质、 t 界 值 表 查 表 一、t分布的概念 t 分 布 的 概 念 --续 当总体标准差未知时,可作正态变量 的t转换: t分布与标准正态分布的联系:t分布只有1个参数:自由度(?=n-1)。 ? 逐渐增大时,t分布逐渐逼近标准正态分布。当?=∝时,t分布就完全成为标准正态分布了。 二 t分布的图形和特征 t分布是一簇曲线,自由度?决定曲线的形状。当ν?∞,t分布?正态分布 以0为中心,左右对称的单峰曲线 t值表的使用(P804) 横标目:自由度υ(1,2,3,…,∞) 纵标目:概率P(双侧:0.05, 0. 01,… 0.001 ) (单侧:0.025,0.005,… 0.0005 ) t界值:一侧尾部面积为单侧概率,两侧尾部面积之和称为双侧概率。 t值表的使用—续 t分布曲线两端尾部面积表示在随机抽样中,获得的t值大于等于某t界值的概率,即P值。 例如:当?=9时,双侧概率α=0.05时,查t界值表得 t(0.05, 9) = 2.262 。 含义为: t值表中: ?相同时,t值越大, P值越小; P值相同时,自由度? 值越大,t值越小; t值相同时,双侧概率P为单侧概率P的两倍。 t分布的应用: 总体均数的区间估计 t检验 第三节 总体均数的置信区间估计confidence interval 可信区间的概念 总体均数可信区间的计算 均数可信区间与参考值范围的区别 一、可信区间的概念 统计推断:参数估计与假设检验。 参数估计: parametric estimation,用样本统计量估计总体参数的方法。 点(值)估计:point estimation,直接用样本统计量作为总体参数的估计值。方法简单但未考虑抽样误差大小。 区间估计:interval estimation,按预先给定的概率95%,或(1-?),确定的包含未知总体参数的可能范围。考虑了抽样误差。 可信区间的含义confidence interval, CI 有1- ?(如95%)的可能认为计算出的可信区间包含了总体参数。 例4.3 某市随机抽查12岁男孩100人,得身高均数139.6cm,标准差6.85cm。该地12岁男孩身高均数的95%可信区间为:138.3(cm)~141.0 (cm)。可信区间不含可信限。 Confidence limit,CL。 下限,lower limit,L/L1。 上限,upper limit,U/L2。 总体均数的可信区间原理 按t分布的原理得出 二、总体均数可信区间的计算 1、s已知时:总体均数的95%置信区间为: 2、s未知、且样本例数较少时,按t分布原理 总体均数的95%置信区间为: 例9.10 随机抽取某地健康男子20人,测得样本的收缩压均值为118.4 mmHg,标准差为10.8mmHg
文档评论(0)