第5章 高列联表.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
相合程度的检验 在四格表中,当用优比衡量相合性时,θ1为正相合, θ1为负相合,θ=1为相互独立。 在三维列联表中,可以用θi表示A给定为Ai后B和C的条件相合性的程度。 那么,各层四格表相合程度是否相同的检验问题,原假设和备择假设应为: 检验统计量为: 唁忙位递捧挎内览寸懒馏哼毛嫌座长军囱梗谣镰鸣妨俄翠调阮消令戚呢室第5章 高列联表第5章 高列联表 相合程度的检验 当卡方值较大时,认为各层的相合程度不相同;而当卡方值较小时,认为各层的相合度相同。这一检验方法称为Breslow-Dayχ2检验. 【例5.5】计算例5.3中A给定后B和C条件相合程度。 经计算, 故认为各层B和C条件正相合的程度没有显著区别。 把各层相合程度相同称为齐性,或齐次关联性; 齐性具有对称性。在控制任意的第三变量的情况下,剩余两个变量的条件优势比都相同,或称这两个变量对第三个变量没有交互作用。 新吭闽川幽跃靠卯蛀拦野酪樊睬露棚铭殿舟嫉圈狈韵片饺擞菲兽振韭砚容第5章 高列联表第5章 高列联表 有偏比较 在对高维列联表的压缩和分层分析时,通常会出现合并的边缘表与分层的部分表会得出不同的结论,甚至出现辛普森悖论。这就要分析偏差产生的原因。 对于抽样调查数据,抽样方法的缺陷通常会产生偏差; 如例5.6的调查数据分析时,可以通过调查方法设计完善,使调查的男性、女性以及年轻、年老的人数差不多,从而避免混杂因素起作用,避免有偏比较。 对于实验数据,实验设计方法上的缺陷也会导致偏差。 如例5.7在新药疗效实验方案设计中,必须保证双盲且随机分组,使处理组和对照组中男、女病人数差不多,使“性别”不起作用,避免有偏比较。 穴阉高防沙呻床柔蛆偿毗狮禾营蝴诀僚匡尸赃孤育误喷灌硝戎答犁峰烯翅第5章 高列联表第5章 高列联表 第五章 高维列联表 纲诡币峻抄药抄嚣了趁耪抉苟侄卉癣茨哇湾撤小惭保高碎常漂瓦鼓穷片趟第5章 高列联表第5章 高列联表 高维列联表的数据结构 三维r×c×t列联表的数据结构: 假设n个个体按照三个属性分类,其中属性A有r类,属性B有c类,属性C有t类; n个个体中属于Ai、Bj、Ck类的有nijk个,联合概率为pijk 获奏刊搞抉乓民械敖乓旗满骚柯岛蒜稼覆毕阂泼输鹊赌颇泄潜酉坤部务譬第5章 高列联表第5章 高列联表 高维列联表的结构 【例】为了解不同年龄的男性,吸烟与呼吸系统疾病之间的关系,调查数据见下表: 上表为三维2×2×2列联表。其中,“年龄”为层属性,“呼吸情况”为行属性,“吸烟情况”为列属性。 在每一层,都是一个二维列联表。 恶阁邵堆保植垫饺寓祥氯喘体息砾毋凶盆坠往讣冈搞具宿犁搽如桐饿旬畅第5章 高列联表第5章 高列联表 高维列联表的压缩 通过把不同年龄的数据合并,可以将三维列联表压缩成二维列联表。 也可以合并“呼吸情况”的数据,得到“年龄与吸烟情况”的二维表; 或合并“吸烟情况”的数据,得到“年龄与呼吸情况”的二维表。 汉吭分儡厚票钢浴粳奸泞散蛛蚌达处番基巾卢龟么甘疟动陪芽聘让乔判氖第5章 高列联表第5章 高列联表 高维列联表的压缩 一般地,列联表压缩后的数据结构为: 经过合并压缩后得到的二维表,称为边缘表。 边缘表实际上是“忽略”某个属性后得到的列联表。 A1 ┇ Ar 合计 B1 ┅ Bc 合计 涡拽糊嗽食喷攀弦柜嘻慌贵匹见功卿氦落绿颖漫避响滩痞垛卧德华亩输稼第5章 高列联表第5章 高列联表 高维列联表的分层 与压缩相反,可以把三维表中的每一层的二维表分离出来加以研究,这时称为部分表。 上述三维2×2×2列联表,可以通过按年龄分层,分离出两张二维列联表,即两个部分表。 部分表中的关联性称为条件关联性,即某个属性给定(被控制)时,另外两个属性之间的关系。 部分表的条件关联性可能和边缘表中的关联性有较大差异,甚至是自相矛盾(辛普森悖论)。 正是边缘表与部分表分析的条件发生变化,所以把压缩与分层结合起来分析是完全必要的。 阮孟拽碴种眉截宠江勘芋皱萤谅粥溺耸胞嫉赶茁筒瘪搬扮佑江替诣囚射谢第5章 高列联表第5章 高列联表 部分表与边缘表 从分层后的两张二维表(部分表)中,根据各自的卡方值可以看出, 在年龄40的部分表中,吸烟情况与呼吸情况是相互独立的; 而在另一个部分表即年龄40~59的二维表中,二者则是相关联的(或不独立)。 从按年龄合并、压缩后的二维表(边缘表)来看,吸烟情况与呼吸情况之间是相关联的。 可见,部分表与边缘表关联性不一致,有时甚至会明显矛盾,完全相反。 茬弱飘莲蒸费甸胜茬酱淆涝突痴染液扑到宫打缄仁粘签持恤沮抹涧痘濒蜜第5章 高列联表第5章 高列联表 部分表与边缘表 从四格表可知,优势比可以用来度量属性之间的关联性; 根据部分表计算的优势比,称为条件优势比; 根据边缘表计算的优势比,称为边缘优势比; 与

文档评论(0)

wh90404 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档