多水平统计模型讲解.ppt

  1. 1、本文档共108页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
例: 多水平模型及其对肝癌患者住院费用影响因素的分析 资料来源 资料来源于广州市某三甲医院信息系统( 广东省统计病案管理系统) 的病历资料, 本研究采用ICD- 10 编码, 选取编码为C22. 001( 原发性肝癌) 的病例, 收集该医院2003--2008年的住院患者共1659 例( 男1440 例, 女219 例) 。主要摘录患者的一般情况( 病案号, 性别, 年龄, 婚姻状况) , 入院情况, 疗效, 付款方式, 抢救情况, 手术情况, 住院天数, 住院费用( 总费用) 等。 根据医院科室功能和患者例数情况, 归纳为21 个科室。住院费用、住院天数都是非正态分布的资料, 经对数变换后进行分析。肝癌患者的平均年龄为52 岁, 为了使模型截距有意义, 对年龄进行总体均数中心化, 即将年龄减去总体均数。X 表示第一水平解释变量, W 表示第二水平解释变量。 (2)空模型纳入第二水平解释变量 (3) 第一水平模型纳入第一水平解释变量 考虑随机效应解释变量的多水平模型 以上是把第一水平的解释变量全部假设为固定效应变量, 即认为解释变量对结局变量的效应在组间是无差异的, 但是在实际中有些解释变量对结局变量的影响是会随着组单位的不同而变化的, 即还需要确定第一水平解释变量是否有随机效应。结果显示手术情况( X 8 ) 、住院天数( X 9 ) 为随机效应, 并且各随机效应之间无相关关系 4.检验水平1随机斜率 多层模型中,不仅结局测量组均数会跨组变化,而且水平1解释变量与结局测量之间的关系也会随组群的变化而变化。 检验跨层交互作用 Cross-level interaction:如果某个场景变量对水平1随机系数有显著效应,表示水平1解释变量与应变量之间的关系依赖于组水平的解释变量,或受场景变量的影响和调节。 结果与分析 (1)拟合空模型 截距项方差 残差项方差 截距项 科室分区 残差 假定已知方差 的值,则可直接构造分块对角阵 ,简记为 。直接采用通常的广义最小二乘法(Generalized Least Squares GLS)可获得固定系数的估计: 在初始阶段,假定 为 0 ,即假定数据不具有系统结构,则给出固定系数通常的 OLS 估计 ,得到粗残差: 将粗残差向量记为: 将粗残差向量形成交叉乘积矩阵 ,然后再形成交叉乘积矩阵 的向量化算子,记为 。相应的,也可以形成反应变量协方差阵 向量化算子,记为 。 对应于 2 个医院,一个诊疗 3 名患者,另一个诊疗 2 名患者,则 和 均具有 32+22=13 个元素。因为 的期望为 可将这些向量间关系表达为以下线性模型 = +R= + +R 这里, 为一个残差向量。将粗残差作为模型的反应变量向量,模型右边包含两个已知的解释变量,其系数即待估计的随机参数 和 。通过 GLS 方法获得 和 的估计,回到初始模型则获得固定系数新的估计,在随机与固定参数估计间反复迭代直至收敛,此即 IGLS 算法的基础。 1. 重复测量数据的多水平模型 当同一研究对象被重复测量多次时,测量点即为水平 1 单位,测量点又嵌套(nested)进作为水平 2 单位的个体,这种数据结构具有典型的层次结构特征。 多水平模型的应用 在临床试验和动物实验中,常需对患者或动物的某些指标进行重复测量,以了解不同时间观测指标的变化以及处理因素与观测指标的关系随时间的变化;在生长发育研究中,也需对个体生长或发育指标作多时点的重复测量。 常规使用的重复测量数据统计方法,一般要求资料是平衡的,即每一个体有相同次数的重复测量值,这对于实验研究是可行的,但在生长发育研究中,测量常常是不规则的,这就出现了个体测量时点多少不一、时间间隔不等以及观测值缺失等问题,它增加了传统统计方法拟合个体生长曲线的难度,并引起估计结果不同程度的偏差。 多水平模型技术可有效和方便地处理此类测量模式的数据,提供统计上有效的参数估计,并具有如下几个特点: (1) 考虑了分布于不同层次的测量误差,并给出相应的误差估计值; (2) 拟合个体生长曲线时不要求相等的时间间隔,在拟合个体生长曲线的同时也估计全部样本的平均曲线; (3) 不要求每个个体都有同样多的测量点,即缺失测量点并不增加拟合生长曲线的难度; (4) 便于在生长曲线中引入其它解释变量,如性别、营养状况等,分析其对生长过程的影响。 2. Meta分析是指对具有相同研究假设的多

文档评论(0)

光光文挡 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档