具有相关关系的二分类资料处理方法比较.pdfVIP

具有相关关系的二分类资料处理方法比较.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国卫生统计年 月第 卷第 期 具有相关关系的二分类资料处理方法比较 第四军医大学卫生统计教研室 张春茂 李婵娟 蒋志伟 夏结来 【提 要】 目的 探讨分析具有相关关系的二分类资料的有效处理方法。方法 采用蒙特卡罗模拟比较广义估计 方程和广义随机效应模型与一般 回归在处理具有相关关系的二分类资料的区别。结果 一般 回归处理相 关关系的二分类资料时假阳性率增加。广义估计方程与广义随机效应模型是处理该类型资料时, 类错误能稳定控制在 . 左右,且检验效能基本一致。结论 广义估计方程和广义随机效应模型是处理具有相关关系的二分类资料的合适方 法,不能采用一般 回归代替。 【关键词】 广义估计方程 广义随机效应模型 回归 二分类资料 一 般线性模型用于研究某一因变量 与自变量,,它是广义线性模型与线性随 之间的线性关系。要采用此模型,需满足独立、正态、 机效应的扩展。以二分类反应变量为例,一般线性和等方差的假定。但是在实际应用中,很多模型 回归模型可以表示为: 属于非线性模型,如回归模型,不能满足一般 / 线性模型应用的条件。 和于随机效应回归是回归模型的扩 年对一般线性模型做了直接推广,首次提出广义线性 展,构造一个只包括随机截距项的随机效应回 模型:广义线性模型中,因变量的分布不再局限于连续 归模型为: 的分布,可扩展到非连续性的资料,如二项分布等;自变量的线性预测值等于因变量的函数的估计值?。 其中 指二水平的试验单位,.『指一水平试验单位 常用的广义线性模型包括线性回归、回归和 嵌套的试验单位 , 为随机效应项。随机效应项代 回归等,模型可表示为: 表了二水平的试验单位对其嵌套试验单位或者重复测 叼叼 量因素的效应,该部分效应不能被协变量,解释,这 和/ 分别为固定效应的设计矩阵和参数向量, 意味着不同二水平单位间的模型参数是不同的。运用 为自变量的线性预测值。 表示连接函数。 这种方法,一水平试验单位问的相关性引起的变异被 该模型为一固定效应模型,要求所有观察指标问相互 独立出来,这部分变异是由二水平试验单位的内在特 独立,因此不能用于分析具有相关关系的数据。比如, 性引起,这种特性在不同的二水平试验单位间是不同 在群组随机化设计中,受试者嵌套与随机化单位内,同 的,且无法实际观测到 。随机效应项通常假定服从 一 随机化单位内的受试者是相关的,此类数据我们称 正态分布,即Ⅳ ,, 用于表示一水平试验单位 为群组数据;在纵向研究中,重复测量 总体的离散程度。包含随机效应项的模型,其反应变 因素嵌套于每一位受试者中,同一受试者多次重复测 量的期望可以通过下式表示: 量的数据间是相关的,此类数据我们称为多水平数据 ,, 或者多层次数据 。 因此把广义随机效应模型又称为条件概率模型, 对此具有相关结构的数据进行分析时均需要对广义线 而把下文将要提到的广义估计方程称为边际模型。把 性模型进行修正,采用的方法有广义随机效应模型、广 随机效应回归模型推广至广义随机效应模型, 义估计方程等。 可以表示为 :, /处理方法 和 为固定效应和随机效应的设计矩阵, 和, .广义随机效应模型 为模型的固定效应和随机效应的参数向量。由于自变 为了分析具有相关结构的数据,把随机效应项加 量和应变量间非线性关系和随机效应向量的存在,利 人模型以反映数据问相关性的大小。新的模型中既包 用极大似然法对模型的参数进行估计比较困难,可采 括固定效应也包括随机效应,因此广义随机效应模型 用近似的方法进行估计。一种方法是利用基于一阶 又称为广义线性随机效应模型展开式的伪似然函数进行参数估计,通过迭代 使线性化伪变量达到最大,这种估计方法可以通过 △通讯作者:夏结来, ? : . . 软件的% 宏和 过程步实 .. . . . 现。另外一种方法是通过积分解决 ,/ 为总体均数, 和 为固定效应和随机效应的设计 矩阵, 为模型的固定效应的参数向量, 为随机效应 极大似然法中积分求解的难题,可以通过软件的 过程步实现。或者考虑采用贝叶斯方法 的参数向量且 ~ ,: , 为残差项且 ~ , 进行估计,不仅可以对包含复杂结构的线性预测值进 : 。 值通过设定的界值 转化为二分类反应变量。 行解释,而且当随机效应服从其他分布时亦可计算,而 为了模拟的方便,设定,, 为组别效应的设 现在的统计软件比如只能假定随机效应项服从 计矩阵, 为组别效应的参数向量,不设置其他协变 正态分布 。 量。 .广义估计方程 .不同样本量下三种统计分析方法比较 广义估计方程 算法 是 和 在广 设定一水平试验单位在二水平试验单位内平均分 义线性模型基础上提出的一种拟似然估计方法,可用 配,每个二水平试验单位内嵌套 个~级试验单位, 于分析组内相关性的资料。

文档评论(0)

jsntrgzxy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档