多水平模型简介技巧.ppt

  1. 1、本文档共91页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2)由于协变量,即CT图像本身的纹理特征对反应变量的效应在患者水平2间是固定不变的,且因变量是二值变量,故在上述拟和零模型的基础上,逐步引入协变量,进一步拟合二分类反应变量的方差成分模型 。 实例分析   例: 研究调查2型糖尿病患者对社区医疗服务的满意程度,采用两阶段随机抽样,先在某地区随机抽取69名社区医生,然后在每名医生所在的诊所抽取若干2型糖尿病患者,共计纳入1482名患者,每名入选医生需填写个人相关资料,包括个人背景、从业时间等。每名入选患者除提供基本资料外,需完成一份满意度调查问卷。该问卷总分为100分,分数代表了患者对医疗的满意程度。 分析: 这里69名社区医生是某地随机选择的样本,研究目的不是估计患者对这69名医生的满意程度,而是估计这69名社区医生代表的该地区所有社区医生的情况。因此,对该地区所有的医生而言,这69名医生的调查结果是随机的,若分析患者对不同医生医疗服务的满意程度有无差别时,社区医生(为相应总体的随机样本)和患者构成了两个水平。 MLwiN软件简介 MLwiN – Multilevel modelling of N-level data for Windows (Bristol University, UK) ML2 (1988-1990) ML3 (1990-1992) ML3E (1992-1995) MLn (1995-1998) MLwiN (1998- present) http://www.cmm.bristol.ac.uk/ 系统界面 多水平Poisson回归模型实例 Poisson回归(Poisson regression) 单位时间、面积、空间内某事件发生数(count)的影响因素的分析 对于以人群为基础的稀有疾病发病率、卫生事件资料的分析 例 收集英格兰和威尔士15个地区1959至1991年按年龄、性别分组的逐年人口数和肺癌死亡人数。 肺癌死亡资料数据库变量编码 指标 变量 变量取值 年份 Year year=年份1959-1991 地区 region 1~15 年龄 age age=0,年龄≤50岁;age=1,年龄>50岁 性别 gender gender=0,女性; gender=1,男性 年观察人口数 population 年肺癌死亡数 death 资料特点 两水平层次结构 地区(水平2单位) 15 各地区内逐年重复观察(水平1单位) 1980 资料按性别、年龄分组 反应变量是肺癌死亡人数   定性反应变量的多水平模型   重点:二分类反应变量的两水平模型 某省调查其农村居民的卫生服务 随机抽取30个乡镇,每个乡镇分别抽取2个行政村,每个村再随机抽取33户(家庭),对每个家庭前半年内的常住人口进行问卷调查。 调查研究 资料的特点 具有明显的层次结构(乡镇 行政村 户 个体) ; 在经济水平、生活方式、生活习惯上都具有某种程度上的相似性或聚集性 ;个体的数据是非独立的 。 固定效应和随机效应 固定效应:某研究中有多个不同的处理因素,若研究者感兴趣的各种处理因素都设计在研究当中,则认为这一因素具有固定效应。 随机效应:若处理包含的各个组别是从更大的总体中得到的随机样本,则认为该处理因素具有随机效应。 二分类反应变量两水平模型 优势 处理具有层次结构特征的数据资料,可将传统模型中的随机误差项分解到与数据层次结构相应的水平上,使得个体的随机误差更纯 。 普通Logistic回归模型 令: y=1 发病(阳性、死亡、治愈等) y=0 未发病(阴性、生存、未治愈等) 将发病的概率记为P,它与自变量x1, x2,…,xp之间的Logistic回归模型为: 可知,不发病的概率为: 两水平logit模型 为处理因素的效应参数,又称固定效应(fixed effect)参数 为水平2单位的logit均值 与总均值 之差,又称为随机效应(random effect)或高水平的残差。 的方差 又称为随机参数(random coefficient),反映了高水平单位间的比数(率)的差别。 越大说明数据在高水平单位内的聚集性越强。 为0时,该模型演变为一般的logistic回归模型。 判断是否存在高水平效应 密切结合专业知识和具体情况进行判断 对随机参数 的估计值做检验 例:探讨高血压的影响因素 在全市共抽取159个社区(53个生活社区和106个功能社区)作为调查社区,每个社区抽取100人左右,共抽

文档评论(0)

123****6648 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档