具有相关关系的二分类资料处理方法比较.pdfVIP

下载本文档

22
0
约4.71千字
约 4页
2018-04-10 发布于江苏
举报
版权申诉

具有相关关系的二分类资料处理方法比较.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

中国卫生统计年月第卷第期具有相关关系的二分类资料处理方法比较第四军医大学卫生统计教研室张春茂李婵娟蒋志伟夏结来【提要】目的探讨分析具有相关关系的二分类资料的有效处理方法。方法采用蒙特卡罗模拟比较广义估计方程和广义随机效应模型与一般回归在处理具有相关关系的二分类资料的区别。结果一般回归处理相关关系的二分类资料时假阳性率增加。广义估计方程与广义随机效应模型是处理该类型资料时, 类错误能稳定控制在 . 左右,且检验效能基本一致。结论广义估计方程和广义随机效应模型是处理具有相关关系的二分类资料的合适方法,不能采用一般回归代替。【关键词】广义估计方程广义随机效应模型回归二分类资料一般线性模型用于研究某一因变量与自变量,,它是广义线性模型与线性随之间的线性关系。要采用此模型,需满足独立、正态、机效应的扩展。以二分类反应变量为例,一般线性和等方差的假定。但是在实际应用中,很多模型回归模型可以表示为: 属于非线性模型,如回归模型,不能满足一般 / 线性模型应用的条件。和于随机效应回归是回归模型的扩年对一般线性模型做了直接推广,首次提出广义线性展,构造一个只包括随机截距项的随机效应回模型:广义线性模型中,因变量的分布不再局限于连续归模型为: 的分布,可扩展到非连续性的资料,如二项分布等;自变量的线性预测值等于因变量的函数的估计值?。其中指二水平的试验单位,.『指一水平试验单位常用的广义线性模型包括线性回归、回归和嵌套的试验单位 , 为随机效应项。随机效应项代回归等,模型可表示为: 表了二水平的试验单位对其嵌套试验单位或者重复测叼叼量因素的效应,该部分效应不能被协变量,解释,这和/ 分别为固定效应的设计矩阵和参数向量, 意味着不同二水平单位间的模型参数是不同的。运用为自变量的线性预测值。表示连接函数。这种方法,一水平试验单位问的相关性引起的变异被该模型为一固定效应模型,要求所有观察指标问相互独立出来,这部分变异是由二水平试验单位的内在特独立,因此不能用于分析具有相关关系的数据。比如, 性引起,这种特性在不同的二水平试验单位间是不同在群组随机化设计中,受试者嵌套与随机化单位内,同的,且无法实际观测到。随机效应项通常假定服从一随机化单位内的受试者是相关的,此类数据我们称正态分布,即Ⅳ ,, 用于表示一水平试验单位为群组数据;在纵向研究中,重复测量总体的离散程度。包含随机效应项的模型,其反应变因素嵌套于每一位受试者中,同一受试者多次重复测量的期望可以通过下式表示: 量的数据间是相关的,此类数据我们称为多水平数据 ,, 或者多层次数据。因此把广义随机效应模型又称为条件概率模型, 对此具有相关结构的数据进行分析时均需要对广义线而把下文将要提到的广义估计方程称为边际模型。把性模型进行修正,采用的方法有广义随机效应模型、广随机效应回归模型推广至广义随机效应模型, 义估计方程等。可以表示为 :, /处理方法和为固定效应和随机效应的设计矩阵, 和, .广义随机效应模型为模型的固定效应和随机效应的参数向量。由于自变为了分析具有相关结构的数据,把随机效应项加量和应变量间非线性关系和随机效应向量的存在,利人模型以反映数据问相关性的大小。新的模型中既包用极大似然法对模型的参数进行估计比较困难,可采括固定效应也包括随机效应,因此广义随机效应模型用近似的方法进行估计。一种方法是利用基于一阶又称为广义线性随机效应模型展开式的伪似然函数进行参数估计,通过迭代使线性化伪变量达到最大,这种估计方法可以通过 △通讯作者:夏结来, ? : . . 软件的% 宏和过程步实 .. . . . 现。另外一种方法是通过积分解决 ,/ 为总体均数, 和为固定效应和随机效应的设计矩阵, 为模型的固定效应的参数向量, 为随机效应极大似然法中积分求解的难题,可以通过软件的过程步实现。或者考虑采用贝叶斯方法的参数向量且 ~ ,: , 为残差项且 ~ , 进行估计,不仅可以对包含复杂结构的线性预测值进 : 。值通过设定的界值转化为二分类反应变量。行解释,而且当随机效应服从其他分布时亦可计算,而为了模拟的方便,设定,, 为组别效应的设现在的统计软件比如只能假定随机效应项服从计矩阵, 为组别效应的参数向量,不设置其他协变正态分布。量。 .广义估计方程 .不同样本量下三种统计分析方法比较广义估计方程算法是和在广设定一水平试验单位在二水平试验单位内平均分义线性模型基础上提出的一种拟似然估计方法,可用配,每个二水平试验单位内嵌套个~级试验单位, 于分析组内相关性的资料。