- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五讲四格表讲述
第五讲 四格表及单侧给定时的检验一、引例例选择63个肺癌病例,选择43个与肺癌患者年龄、性别和其它属性相类似的健康人作为对照组。然后分别调查肺癌患者和对照组中的人的吸烟情况。调查结果如表1。表1 调查结果吸烟不吸烟合计肺癌患者60363对照组321143合计9214106调查结果算得肺癌患者中吸烟的比率为60/63=95.2%,对照组中吸烟的比例为32/43=74.4%。问总体中肺癌患者吸烟的比例是否比健康人吸烟的比例高?二、四格表1、记号表示既有属性A,又有属性B的个体数;表示有属性A,但没有属性B的个体数;表示没有属性A,但有属性B的个体数;表示既没有属性A,又没有属性B的个体数;表示具有属性A的个体数;表示不具有属性A的个体数;表示具有属性B的个体数;表示不具有属性B的个体数;表示总的个体数。2、四格表表2 四格表及其边际合计合计3、四格表的抽样方式四格表的边际有五个数,按边际是否给定有如下四种不同的抽样方式:(1)单侧给定,如给定,中只有两个如是随机变量,它们相互独立。方程组有两个独立的自由未知量。(2)样本容量给定,中有三个如是随机变量,它们相互独立。方程组有三个独立的自由未知量。(3)都没有给定,即完全随机时,都是随机变量,它们相互独立。(4)两侧都给定,即给定时,中只有一个随机变量。,所以方程组自由未知量的个数为4-3=1个。三、四格表的独立与不相关1、一般场合相互独立不相关2、正态分布场合设,则相互独立不相关3、四格表场合(1)记号表示既有属性A,又有属性B的概率;表示有属性A,但没有属性B的概率;表示没有属性A,但有属性B的概率;表示既没有属性A,又没有属性B的概率;表示具有属性A的概率;表示不具有属性A的概率;表示具有属性B的概率;表示不具有属性B的概率;。(2)概率四格表表3 概率四格表及其边际分布合计合计(3)四格表的独立与不相关等价属性A,B相互独立,属性A,B不相关四、单侧给定时四格表的检验1、基本结论设单侧给定。记,。则当单侧给定时,相互独立,且,。此时有,,即,“具有属性A的个体中具有属性B的比例,与不具有属性A的个体中具有属性B的比例相等”等价于“属性A与属性B相互独立”。2、单侧给定时四格表的检验(1)原假设原假设备择假设有方向检验(属性A,B相互独立)(有属性A的个体中有属性B的比例高)(属性A,B相互独立)(有属性A的个体中有属性B的比例低)无方向检验(独立性检验)(属性A,B相互独立)(属性A,B不独立)(2)近似检验原假设备择假设检验统计量渐进分布水平拒绝域p值有方向检验无方向检验(3)连续性修正后的近似检验原假设备择假设检验统计量渐进分布水平拒绝域p值有方向检验无方向检验(4)独立性的似然比检验原假设备择假设检验统计量渐进分布水平拒绝域p值独立性检验4、引例分析(1)数据吸烟不吸烟合计肺癌患者60363对照组321143合计9214106(2)有方向检验原假设备择假设检验统计量水平拒绝域p值近似检验连续性修正后的近似检验检验结果表明,在水平下,肺癌患者中吸烟的比例显著大于健康人的吸烟比例。注:有方向检验时假设的一般提法:(1)若,检验问题一般为:vs:;(2)若,检验问题一般为:vs:;5、某时的情况(1)结构0,或先验0如果根据问题可确定某,如时,该0称为结构0,或先验0。如某会议组织者为了解参会者喜欢提供的哪一类食物,作了一次调查,调查数据如下表:荤菜素菜合计素食主义者03030非素食主义会者203人,其中30人是素食主义者,他们不可能喜欢荤菜,所以素食主义者中喜欢荤菜的人数肯定为0,此时有结构(先验)0的四格表的统计分析简化为非素食主义者喜欢哪一类食物的统计分析。(参见第四章)(2)非结构0由于比较小,当样本量不够大时,相应的可能出现为0,此时可通过在抽样增加样本量消除;如若不能在抽样可直接进行检验:法一:直接检验,代入检验统计量进行检验法二:先对每个频数增加一个正的常量,,,再基于,进行检验如,有一张某一项为0的四格表如下有属性B没有属性B合计有属性A6713没有属性A088合计61521检验问题::vs:(1)代入检验统计量进行检验检验统计量:似然比检验统计量:(2)每个频数增加一个正的常量有属性B没有属性B合计有属性A6.57.514没有属性A0.58.59合计71623基于该表进行检验检验统计量:似然比检验统计量:五、总的样本容量给定时四格表的检验1、基本结论(1)给定时,随机向量;(2)若,给定,,则随机变量相互独立,且,。其中,。2、原假设原假设备择假设有方向检验(属性A,B相互独立)(有属性A的个体中有属性B的比例高)(属性A,B相互独立)(有属性A的个体中有属性B的比例低)无方向检验(独立性检验)(属性A,B相互独立)(
文档评论(0)