9_对数线性模型分析.pptVIP

下载本文档

52
0
约3.81千字
约 31页
2018-05-22 发布于河南
举报
版权申诉

9_对数线性模型分析.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

9_对数线性模型分析

对数线性模型分析 Log-linear Model Analysis 变量的模型分析比较什么是对数线性模型分析？总结 Logistic回归分析和卡方分析的优缺点是什么？对数线性模型分析的优缺点是什么？什么是条件独立模型、联合独立模型和完全独立模型？在什么情况下可以压缩变量？结束 * 流行病与卫生统计学系分类变量的主要统计分析方法卡方分析 Logistic回归分析对数线性模型分析多元线性回归分析： Y 是数值型变量 X 是任意变量 Logistic回归分析： Y 是分类型变量 X 是任意变量对数线性模型分析： Y 是分类型变量 X 是分类型变量第一节对数线性模型的基本概念一、频数分布： 1、列联表 (contingency table) 2、维数 (dimension) 3、行(row)、列(column)、层(layer)变量 4、网格频数 (cell frequency) 二维对数线性模型： M i j 为第 i 行第 j 列网格频数X i j 的理论值或期望频数值(expected ferquency) 总均值主效应A 主效应B 交互效应AB 第二节对数线性模型限制条件： 1、一阶交互效应模型 2、完全独立模型二维对数线性模型的分类：三维对数线性模型： M i j k为第 i 行第 j 列第k层网格频数X i jk 的理论值或期望频数值。总均值主效应A,B,C，交互效应AB,AC,BC，ABC 三维对数线性模型的分类： 1、二阶交互效应模型 --- （9-8） 2、无二阶交互效应模型 --- （9-22） 3、条件独立模型 ---（9-23） 4、联合独立模型 ---（9-24） 5、完全独立模型 ---（9-25）对数线性模型分析是把列联表资料的网格频数的对数表示为各变量及其交互效应的线性模型，然后运用类似方差分析的基本思想检验各变量及其交互效应的作用大小。模型的独立参数和自由度：独立参数的个数 = 分类数 - 限制条件数数据提供的信息量=列联表中网格的数目模型的自由度= 信息量 - 独立参数个数饱和模型和非饱和模型饱和模型：独立参数的个数=列联表的网格数非饱和模型：独立参数的个数列联表的网格数分层模型如果一个高阶效应出现在模型中，那么组成这个高阶效应的所有低阶效应也必须出现在模型中。第三节对数线性模型分析的方法步骤一、参数的估计和假设检验二、模型的拟和优度检验三、模型参数的意义解释第四节对数线性模型的选择原则： 1、应当包含尽可能少的参数；每个参数要有显著意义(p0.05)； 2、模型总体拟和度高(p0.05)。第五节对数线性模型在医学中的应用比较三种分析方法的优缺点： 1、卡方检验：简单易学，不需要确定因变量和自变量。但是，卡方检验对三维和三维以上列联表资料的分析有一定困难，即对混杂变量的控制较难。 2、Logistic回归分析：解决了对混杂变量的控制的问题，而且，它能将因变量与自变量的关系用模型表示出来，清晰易理解。但是，当模型中自变量较多，特别是名义变量较多，或名义变量的类别较多时，分析自变量之间的交互效应就很繁杂，可能需要建立很多哑变量。 3、对数线性模型：可以直接分析各种类型的分类变量，对于名义变量，也不需要事先建立哑变量，可以直接分析变量的主效应和交互效应。对数线性模型不仅可以解决卡方分析中常遇到的高维列联表的“压缩”问题，又可以解决logistic回归分析中多个自变量的交互效应问题。【例9-2】为研究产前护理量多少对婴儿死亡率的影响，收集了甲乙两个诊所的资料，数据列在下表中。试用卡方检验，对数线性模型分析和logistic回归分析来分析这组数据。孕妇在两个诊所接受产前护理量与婴儿的存活情解：1）先用卡方检验分别分析两个诊所中产前护理量多少对婴儿死亡率的影响。 2）把这两个诊所的资料合并起来，消除护理地点这个变量。 3）用对数线性模型来分析这组数据。 A：护理地点 B：护理量 C：婴儿存活情况 4）用Logistic回归模型来分析这组数据。 A：护理地点（自变量） B：护理量（自变量）