网站大量收购独家精品文档,联系QQ:2885784924

03-数值变量资料的统计推断PPT.ppt

  1. 1、本文档共139页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
03-数值变量资料的统计推断PPT

四、关于总体均数的假设检验 假设检验中如果无效假设针对总体均数(此处指的是算术均数),通常的方法有t检验与Z检验(专门用于不超过2组的资料)与F检验(用于三组及以上) 如果针对的总体参数是中位数,可以考虑采用秩和检验 t检验 在假设检验中使用了t统计量,所以就称之为t检验 t检验的使用是有条件的,如果不满足条件使用,那么构建t统计量以及使用t分布曲线下面积规律估计概率就是不合理的 什么样的资料可以计算t值? t(Z)检验的使用条件 随机变量是数值变量 个体值满足正态分布或近似正态分布 样本所来源的总体方差齐性 在满足上述条件下,如果总体标准差未知,而且样本含量较小,考虑使用t检验;而如果已知总体标准差或样本含量较大则可以使用Z检验 1、单样本资料的t检验 例如:随机抽查25名男炊事员的血清总胆固 醇,求得其均数为5.1mmol/L,标准差为0.88mmol/L。 问题:该单位食堂炊事员的平均血清总胆固醇含量是否与健康成年男子的平均血清总胆固醇相同 (健康成年男子的平均血清总胆固醇为4.6mmol/L)? 单样本资料的t检验 从资料提供的信息来看,样本均数5.1与总体均数4.6不相等,其原因可有以下两个方面: 样本对应的总体均数等于4.6,差别仅仅是由于抽样误差所致; 除抽样误差外,该单位食堂炊事员与健康男性存在本质上的差异:职业问题? 两种情况只有一个是正确的,且二者必居其一,需要我们作出推断。 单样本资料的t检验 H0:?=4.6,该单位炊事员与正常人的平均血清总胆固醇相等 H1:?≠4.6,该单位炊事员与正常人的平均血清总胆固醇不等(有可能高也有可能低,总之不相等即可) H0假设比较单纯、明确,且在该假设的前提下就有规律可寻。而H1假设包含的情况比较复杂。因此,检验是针对H0的 检验水准a=0.05 单样本资料的t检验 单样本资料的t检验 由于假设是作的是双侧假设,故求P值相应要求双侧P值 这里P值的含义为:样本均数与总体均数差超过0.5mmol/L,即 的概率 所以P=p (t2.841)+p(t-2.841),经过计算机软件得出结果P=0.009025;或者通过上面介绍的方法由于t=2.841t0.05/2,24=2.064,所以P0.05 在a=0.05的水准上,拒绝H0,接受H1,认为该单位炊事员与正常人的平均血清总胆固醇不等 可信区间的计算原理-t分布法 如果总体标准差在研究开始之前无法预知(这是最常见的情况),则我们无法对样本均数作Z转换,只能作t转换: 可信区间的计算原理-t分布法 当样本含量较大(n50),由于ta/2,v与Za/2十分接近,故上述公式可以近似表达为: 例: 某地27健康成年男性的血红蛋白均数为125g/L, 标准差为15g/L。假定血红蛋白值服从正态分布, 试估计总体均数的95%置信区间和99%置信区间 解: 例8-3改 某市2000年随机测量了90名19岁的健康男大学生身高,其均数为172.2cm,标准差为4.5cm,估计他们身高的95%可信区间 解: 可信区间的评价 我们取得未知总体参数的可信区间,如何评价这个区间到底好不好,可信不可信,实用性强不强? 从可信区间的准确度与精确度两个方面进行评价 可信区间的准确度与精确度 假设从七年制临床医学生中抽取一份样本n=10人,求得预防医学平均分为75分,标准差为10分,求总体平均分的可信区间? 现有两位同学求得两个可信区间,甲同学为72~78分 (60%CI) , 乙同学的为60~90分(99.999999%CI) 如何评价? 可信区间的准确度与精确度 从实用性角度来说,甲同学的结果应该更实用些——区间的跨度只有6分,估计得很精确! 但是从可靠程度来说,似乎乙同学的结果更值得信赖——总体均数在该区间外的可能性几乎为0,该区间的可信度极高! 可信区间的准确度与精确度 可信区间的可信度反映了其准确度,可信度越大,错误估计的可能性越小,结果越准确 可信区间的跨度反映了其精确度,精确度越高,区间跨度越小,更趋于某一个点值 但是,这二者的关系是“鱼和熊掌不可兼得”! 可信区间的准确度与精确度 在样本含量与样本标准差固定的情况下,如果要获得精确的参数估计,则可信度必然下降 极端的情况就是使用点估计,此时十分精确,但估计正确的可能性几乎为0! 如果想要得到一个把握很大的参数估计,那么就要把区间扩大些,使得漏估计的可能性尽可能小,此时准确性很高 极端的情况就是宣称“总体平均分应该在0~100分间吧!”但是没有任何实用价值! 准确度与精确度的取舍 根据研究目的与性质取舍 如果没有特殊要求,应该以准确度为主,在保证估计准确的情

文档评论(0)

djdjix + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档