- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
图2 不同自由度下的t 分布图 以0为中心,左右对称的单峰分布; t分布曲线是一簇曲线,其形态变化与自由度的大小有关。 自由度越小,则t值越分散,曲线越低平; 自由度逐渐增大时,t 分布逐渐逼近正态分布(标准正态分布);当趋于∞时,t分布即为正态分布。 t 分布特征 当自由度确定后,t 分布曲线下,双侧尾部的面积或单侧尾部的面积为指定概率 α 时,横轴上相应的 t 值。 t 界值 单侧概率相对应的 t 界值用tα,ν表示; 双侧概率相对应的 t 界值用tα/2,ν表示; 一般的表示方法: 单侧:P(t ≤ - tα,ν) = α 和 P(t ≥ tα,ν)=α 双侧:P(t ≤ - tα/2,ν) + P(t ≥ tα/2,ν ) = α T界值表 t 值表(附表2 ) 横坐标:概率, P, 即曲线下阴影部分的面积; 纵坐标:自由度, υ 表中的数字:相应的 |t | 界值。 T 界值表 同一概率下,自由度越大,|t|越小; 同一自由度下,|t|越大,概率P值越小; 同一自由度下,双侧概率为单侧概率的2倍时,所对应的t界值相等; 当自由度趋向于∞时的t界值即为相应概率下的Z值。 练习题 1.当样本含量增大时,以下说法正确的是( ) A. 标准差会变小 B. 均数标准误会变小 C. 均数标准误会变大 D.标准差会变大 2. 标准误的英文缩写为: A.S B.SE C. D.SD 3. 通常可采用以下那种方法来减小抽样误差: A.减小样本标准差 B.减小样本含量 C.扩大样本含量 D.以上都不对 三 总体均数的估计 统计推断 参数估计 假设检验 参数估计:用样本指标值(统计量) 估计总体指标值(参数)。 点估计 区间估计 统计推断的任务就是用样本信息推论总体特征。 1、 点(值)估计( 近似值) 用相应的样本统计量直接作为其总体参数的估计值。 2、 区间估计(近似范围) 按预先给定的概率(1-α)所确定的包含未知总体参数的一个范围 点估计 由样本统计量 直接估计总体参数 该方法简单,未考虑抽样误差的影响 如:27例健康成年男性血红蛋白量的样本均数为125g/L,若以该样本均数作为总体均数的点估计值,即认为2000年该地所有健康成年男性血红蛋白量的总体均数为125g/L。 区间估计 总体均数的区间估计是按一定的概率(1-α),估计总体参数所在的范围,这个范围称为参数的置信区间(confidence interval, CI)。 (1??)称为可信度或置信度(confidence level),常取95%。 置信区间通常两个数值即置信限(confidence limit,CL)构成, 较小的称为置信下限(lower limit,L), 较大的称为置信上限(upper limit,U) 置信区间的计算 σ未知,且 n 较小,按t分布 σ已知,或σ未知但n足够大,按Z分布 (一)t分布法 查界值表,得双侧,即95%可信区间为: Z0.05/2=1.96 Z0.05=1.645 例:为了解某地成年男子红细胞的总体均数,随机抽查了200名男子,算得红细胞的样本均数为4.95*1012,标准差为0.57,试估计总体均数95%的可信区间。 Z0.05/2=1.96 Z0.05 =1.64 置信区间的含义 总体均数的95%置信区间表示该区间包含总体均数的概率为95%(或99%) 若做100次抽样算得100个可信区间,平均有95(或99)个可信区间包括总体均数,只有5个或1个区间不包括总体均数,即估计错误。 但小概率事件仅仅在一次试验中结果出现错误的可能性很小。 可信区间估计的优劣 一是可信度1??(准确度),愈接近1愈好,如99%的可信度比95%的可信度要好; 二是区间的宽度(精密度),区间愈窄愈好。 当样本含量为定值时,上述两者互相矛盾。 在可信度确定的情况下,增加样本含量可减小区间宽度。 总体均数可信区间与参考值范围的区别 练习1:随机测得某地9名7岁男孩身高资料,均数为121.44cm,标准差为5.75cm,试计算该地7岁男孩身高总体均数的95%可信区间。 下限: 上限: 练习2:某市正常该地成年女子红细胞的抽样调查中,n=90,样本均数4.18x1012/L,标准差0.29x1012/L,试估计该地正常女子红细胞总体均数的95%可信区间。 本例属于大样本,可采用正态近似的方法计算可信区间。因为 ,则95%可信区间为: 下限: 上限: 练习3:对某人群随机抽取20人,用某批号
文档评论(0)