多水平模型简介技巧.ppt

下载文档 降价啦

12
0
约7.79千字
约 91页
2016-08-01 发布于湖北
举报
版权申诉
保障服务

多水平模型简介技巧.ppt

1、本文档共91页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

2）由于协变量，即CT图像本身的纹理特征对反应变量的效应在患者水平2间是固定不变的，且因变量是二值变量，故在上述拟和零模型的基础上，逐步引入协变量,进一步拟合二分类反应变量的方差成分模型。实例分析　　例：研究调查2型糖尿病患者对社区医疗服务的满意程度，采用两阶段随机抽样，先在某地区随机抽取69名社区医生，然后在每名医生所在的诊所抽取若干2型糖尿病患者，共计纳入1482名患者，每名入选医生需填写个人相关资料，包括个人背景、从业时间等。每名入选患者除提供基本资料外，需完成一份满意度调查问卷。该问卷总分为100分，分数代表了患者对医疗的满意程度。分析：这里69名社区医生是某地随机选择的样本，研究目的不是估计患者对这69名医生的满意程度，而是估计这69名社区医生代表的该地区所有社区医生的情况。因此，对该地区所有的医生而言，这69名医生的调查结果是随机的，若分析患者对不同医生医疗服务的满意程度有无差别时，社区医生（为相应总体的随机样本）和患者构成了两个水平。 MLwiN软件简介 MLwiN – Multilevel modelling of N-level data for Windows (Bristol University, UK) ML2 (1988-1990) ML3 (1990-1992) ML3E (1992-1995) MLn (1995-1998) MLwiN (1998- present) http://www.cmm.bristol.ac.uk/ 系统界面多水平Poisson回归模型实例 Poisson回归(Poisson regression) 单位时间、面积、空间内某事件发生数(count)的影响因素的分析对于以人群为基础的稀有疾病发病率、卫生事件资料的分析例收集英格兰和威尔士15个地区1959至1991年按年龄、性别分组的逐年人口数和肺癌死亡人数。肺癌死亡资料数据库变量编码指标变量变量取值年份 Year year=年份1959-1991 地区 region 1~15 年龄 age age=0，年龄≤50岁；age=1，年龄＞50岁性别 gender gender=0，女性； gender=1，男性年观察人口数 population 年肺癌死亡数 death 资料特点两水平层次结构地区(水平2单位) 15 各地区内逐年重复观察(水平1单位) 1980 资料按性别、年龄分组反应变量是肺癌死亡人数　　定性反应变量的多水平模型　重点：二分类反应变量的两水平模型某省调查其农村居民的卫生服务随机抽取30个乡镇，每个乡镇分别抽取2个行政村，每个村再随机抽取33户（家庭），对每个家庭前半年内的常住人口进行问卷调查。调查研究资料的特点具有明显的层次结构(乡镇行政村户个体) ；在经济水平、生活方式、生活习惯上都具有某种程度上的相似性或聚集性；个体的数据是非独立的。固定效应和随机效应固定效应：某研究中有多个不同的处理因素，若研究者感兴趣的各种处理因素都设计在研究当中，则认为这一因素具有固定效应。随机效应：若处理包含的各个组别是从更大的总体中得到的随机样本，则认为该处理因素具有随机效应。二分类反应变量两水平模型优势处理具有层次结构特征的数据资料，可将传统模型中的随机误差项分解到与数据层次结构相应的水平上，使得个体的随机误差更纯。普通Logistic回归模型令： y=1 发病（阳性、死亡、治愈等） y=0 未发病（阴性、生存、未治愈等）将发病的概率记为P，它与自变量x1, x2,…,xp之间的Logistic回归模型为：可知，不发病的概率为：两水平logit模型为处理因素的效应参数，又称固定效应（fixed effect）参数为水平2单位的logit均值与总均值之差，又称为随机效应（random effect）或高水平的残差。的方差又称为随机参数（random coefficient），反映了高水平单位间的比数(率)的差别。越大说明数据在高水平单位内的聚集性越强。为0时，该模型演变为一般的logistic回归模型。判断是否存在高水平效应密切结合专业知识和具体情况进行判断对随机参数的估计值做检验例：探讨高血压的影响因素在全市共抽取159个社区（53个生活社区和106个功能社区）作为调查社区，每个社区抽取100人左右，共抽