第四章 连续型资料的假设检验2.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章连续型资料的假设检验(123)★联系:数据/变量在离散点或区间上分布分布特征数应用样本数据x频数分布表频数分布图描述指标(,Sx)参考范围随机变量X,误差-概率分布表概率分布图总体参数()()置信区间:假设检验P(当前误差|=0)=?条件概率:P(当前误差|=0)=在=0条件下的尾部面积 (记为P)假设检验任务:P≤?(=可忽略的小概率值)P≤则认为≠04.1 假设检验的独特逻辑例3.1 =9.15,95%CI为: (8.15,10.15),文献报道0=10.50区间估计判断“≠0?”:依据N(, 2)(抽样实验)判断准则:95%CI不包含0─→ P<0.05(不能准确估计P值) 95%CI包含0─→ P>0.05本例决策 95%CI不包含0,P<0.05,故认为≠0假设检验判断“≠0?”:依据N(0, 2)(可准确估计P值)f4_1假设检验的步骤及逻辑思维:例3.1中,=9.15(对应),0=10.50,|-0|=1.35样本差异(1.35)原因:抽样误差引起(=0)本质差异引起(≠0)必须在两者中作抉择(1) 建立统计假设(假设前提下才有规律可循)H0:=0=10.50, H1:≠0=10.50 H0比较单纯、明确,在H0下,抽样误差服从某个特定的分布,便有规律可循;而H1却包含着种种未知情形,不容易弄清在H1下有什么规律。故我们着重于考察样本信息是否支持H0(2)计算统计量(统计量的当前值多大?)本例观察变量X服从正态分布N(0,2),今未知,若有H0:0=10.50,则据第三章知识,统计量t =~t分布,=n-1本例=9.15,S=2.13,n=20,统计量t的当前值为t==-2.8345 ,=20-1=19(3)确定P值(当前t值对应的P值有多大?)P=P(|t|≥2.8345)=?(Luo: P=误差─标准t离差不小于2.8345的概率=尾部面积)查t界值表可知:P=P(|t|≥2.093)=0.05,即t0.05=2.093今tt0.05,故P0.05(4)决策与结论(依据小概率值进行决策)决策者事先根据问题性质规定一个可以忽略的、小的概率值,比如=0.05(或0.01)今P<=0.05,标准离差 |t|≥2.8345是小概率事件,可认为目前的差异不是由抽样误差所致,而是两个总体均数不相等。一般地,抉择的标准为:当P≤时,拒绝H0,接受H1;当P>时,不拒绝H0结果报告:首先给出统计推断结果,即列出统计量、P值(尽量用精确值),以及是否拒绝H0;然后结合问题的具体背景给出推断结论。为方便叙述,人们常将拒绝H0说成“差别有统计学意义”(statistically significant difference),简称“有统计学意义” (statistically significant),但不提倡“差别有显著性”或“有显著性差别”的提法,因其易被误解为差别很大;相应地,将不拒绝H0说成“差别无统计学意义”,简称“无统计学意义”。本例结论:t=-2.8345,P<0.02,拒绝H0,接受H1,即认为样本对应的总体均数与文献报导的数值10.50mm/h不相同。结合实际,可认为该类患者血沉值低于10.50。当然,这时第Ⅰ类错误(type Ⅰ error):决策者拒绝H0时可能犯错误,这种错误称为第Ⅰ类错误。P值就是H0成立的条件下,犯第Ⅰ类错误的概率。4.2单组完全随机化设计资料均数的t检验(样本与总体比较)例4.1根据大量调查,健康成年男子脉搏的均数为72次/分。某医生在一山区抽样调查了25名健康成年男子,其脉搏均数为75.2次/分,标准差为6.5次/分,能否据此认为该山区健康成年男子的脉搏高于一般水平?分析因每分钟脉搏数服从正态分布,可用单组完全随机化设计资料均数的t检验作分析。(1) 建立检验假设H0: =0,H1: ≠0(4.1)(2)计算统计量基于已有知识,H0成立时检验统计量t =~t分布(4.2)检验统计量就是以标准误为单位来度量的样本指标与总体参数的标准离差。例如,标准t离差=(3) 确定P值P=P(|t|≥t统计量当前值的绝对值)(4.3)双侧:t=2.69t0.05(24)=2.064,P0.05单侧:t=2.69t0.05(24)=1.711,P0.05(本例)本例双侧与单侧的概率P一致(精确比较是不等的) (4) 决策与结论用双侧还是单侧检验问题(范围/区间/检验):单侧:专业知识推断总体中的数据/参数只能偏向一侧范围:小便中毒物浓度低了仍正常,高过某数值为异常区间:午餐肉亚硝酸含量(不允许高过某数值)检验:本例医学知识认为山区人的脉搏不会慢于一般人双侧:一般情况下单侧问题用了双侧犯小错,双侧问题用了单侧是大错单侧的对立假设为(双侧的对立假设见公式4.1)H1: 0(或H1: 0)(4

文档评论(0)

duwen200621 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档