两组两分类资料检验.ppt

下载文档 降价啦

26
0
约3.62千字
约 41页
2017-03-05 发布于天津
举报
版权申诉
保障服务

两组两分类资料检验.ppt

1、本文档共41页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

两组两分类资料检验

注意事项 McNemar检验只会利用非主对角线单元格上的信息，即它只关心两者不一致的评价情况，用于比较两个评价者间存在怎样的倾向。因此，对于一致性较好的大样本数据，McNemar检验可能会失去实用价值。例如对1万个案例进行一致性评价，9995个都是完全一致的，在主对角线上，另有5个分布在左下的三角区，显然，此时一致性相当的好。但如果使用McNemar检验，此时反而会得出两种评价有差异的结论来。行列表资料的分析分析步骤建立假设 H0：三种不同类型关节炎的疗效相同 H1：三种不同类型关节炎的疗效不全相同求出统计量下结论几点遗留问题是否应当进行两两比较？这又是一个打嘴仗的问题，虽然有人提出用卡方分割等方法来检验，但同样也有学者对这种做法嗤之以鼻实际上，随着统计学的发展，这个问题已被超越，可以使用对分类数据的建模方法，如logistic模型等对此问题加以解答几点遗留问题如果是有序资料该怎么处理传统的卡方检验是无法对次序信息加以利用的单向有序：秩和检验双向有序：实际上考察的是两变量间的关联性（相关性），可以使用专门的关联性指标分析目前对卡方检验还有一些扩展方法，如CMH卡方，可以处理此类问题几点遗留问题行列表卡方检验的适用条件理论频数不宜太小，一般认为不宜有1/5以上格子的理论频数小于5或有一个格子的理论频数小于1 不太理想的办法与邻近行或列中的实际频数合并删去理论频数太小的格子所对应的行或列最理想的办法增加样本含量以增大理论频数（但是可能吗）确切概率法一点补充确切概率法的原理具有通用性，对于四格表以外的情况也适用，如行乘列表、配对、配伍表格均可对于较大的行乘列表，确切概率法的计算量将变得十分惊人，有可能超出硬件系统可以支持的范围此时可以采用计算统计学中的其他抽样技术加以解决，如Bootstrap方法等 Stata计算两个或多个率、构成比的比较 1.Pearson χ2 对两个样本率比较 tabi a b\ c d,chi2 r 其中r表示按行计算比例 2.用Fisher确切概率法检验量个样本率 tabi a b\ c d,chi2 exact 配对四格表资料的分析 mcci a b c d Stata计算行列表资料统计分析双变量无序：Pearson 卡方应用条件：同前。命令：tabi 55 63 44\45 69 23\57 54 36 单变量有序：秩和检验、CMH卡方双变量有序：Spearman等级相关、CMH卡方两组两分类资料检验内容卡方检验入门 1 配对设计两样本率比较的χ2检验 2 行列表资料的分析 3 确切概率法 4 检验分类资料服从某个分布设从总体A中随机抽取一个样本，样本量为n，其资料分布如下：检验分类资料服从某个分布举例：某医生收治在某地50个患者，其血型分别如下：已知该地区的一般人群的血型分布如下：问题：患病人群的血型是否属于该地区一般人群的血样分布血型 A B AB O 人数 15 10 8 17 血型 A B AB O 概率 0.25 0.5 0.1 0.15 实例血型 A B AB O 概率 0.25 0.5 0.1 0.15 理论数T 12.5 25 10 7.5 行列表资料的检验卡方检验是以卡方分布为基础的一种常用假设检验方法，主要用于分类变量，它基本的无效假设是： H0：行分类变量与列分类变量无关联 H1：行分类变量与列分类变量有关联 ?=0.05 统计量，其中Ai是样本资料的计数，Ti是在H0为真的情况下的理论数(期望值)。卡方检验在H0为真时，实际观察数与理论数之差Ai－Ti 应该比较接近0。所以在H0为真时，检验统计量服从自由度为k-1的卡方分布。即：，拒绝H0。上述卡方检验由此派生了不同应用背景的各种问题的检验，特别最常用的是两个样本率的检验等。因为该原理的使用范围很广，但本次课程只学习用于推断两个分类变量是否相互关联。方法原理方法原理理论频数基于H0成立，两样本所在总体无差别的前提下计算出各单元格的理论频数来方法原理残差设A代表某个类别的观察频数，E代表基于H0计算出的期望频数，A与E之差被称为残差。残差可以表示某一个类别观察值和理论值的偏离程度，但残差有正有负，相加后会彼此抵消，总和仍然为0。为此可以将残差平方后求和，以表示样本总的偏离无效假设的程度。方法原理另一方面，残差大小是一个相对的概念，相对于期望频数为10时，20的残差非常大；可相对于期望频数为1000时20就很小了。因此又将残差平