- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[电脑基础知识]spss多水平模型简介
多水平模型简介 四川大学华西公共卫生学院 卫生统计学教研室 李晓松 概述 层次结构数据的普遍性 经典方法及其局限性 基本多水平模型 多水平模型的应用 Anthony Bryk, University of Chicago Stephen Raudenbush, Michigan State University , Department of Educational Psychology 《Hierarchical Linear Models: Applications and Data Analysis Methods》1992 Nicholas Longford, Princeton University, Education Testing Service 《Random Coefficient Models》1993 多水平主成分分析 多水平因子分析 多水平判别分析 多水平logistic回归 多水平Cox模型 多水平Poisson回归 多水平时间序列分析 多元多水平模型 多水平结构方程模型 层次结构数据的普遍性 层次结构数据为一种非独立数据,即某观察值在观察单位间或同一观察单位的各次观察间不独立或不完全独立,其大小常用组内相关(intra-class correlation,ICC)度量。 例如,来自同一家庭的子女,其生理和心理特征较从一般总体中随机抽取的个体趋向于更为相似,即子女特征在家庭中具有相似性或聚集性(clustering),数据是非独立的(non independent)。 非独立数据不满足经典方法的独立性条件,采用经典方法可能失去参数估计的有效性并导致不合理的推断结论。 但非独立数据的组内相关结构各异,理论上,不同的结构应采用相应的统计方法。如纵向观测数据常用广义估计方程(GEE),但有两个局限性:一是对误差方差的分解仅局限于2水平的情形,二是没有考虑解释变量对误差方差的影响。当应变量的协差阵为分块对角阵时,一般采用多水平模型。 经典方法框架下的分析策略 经典的线性模型只对某一层数据的问题进行分析,而不能将涉及两层或多层数据的问题进行综合分析。 但有时某个现象既受到水平1变量的影响,又受到水平2变量的影响,还受到两个水平变量的交互影响(cross-level interaction)。 个体的某事件既受到其自身特征的影响,也受到其生活环境的影响,即既有个体效应,也有环境或背景效应(context effect)。 例如,个体发生某种牙病的危险可能与个体的遗传倾向、个体所属的社会阶层(如饮食文化和口腔卫生习惯)、环境因素(如饮水中氟浓度)等有关。 分解(disaggregation) 聚合(aggregation) 组内-组间分析(within-between analysis) 分解:不满足模型独立常方差的基本假定,回归系数及其标准误的估计无效,且未能区分个体效应与背景效应。一种分析策略是用哑变量拟合高水平单位的固定效应。 聚合:损失大量水平1单位的信息,更严重的是可能导致“生态学谬误”(ecological fallacy)。 组内-组间分析: 每个水平2单位内进行分析,计算组内相关(组内效应); 通过平均或整合得到每个水平2单位的数据,计算组间相关(组间效应); 忽略水平2的存在,在水平1上进行分析,计算水平1单位间的相关(总效应)。 组内相关系数(intra-class correlation, ICC)被当作是总结多层次数据内部相关的最终统计量,但并没有对误差方差进行解释。 多水平分析的概念为人们提供了这样一个框架,即可将个体的结局联系到个体特征以及个体所在环境或背景特征进行分析,从而实现研究的事物与其所在背景的统一。 多水平模型由固定与随机两部分构成,与一般的混合效应模型的不同之处在于,其随机部分可以包含解释变量,故又称为随机系数模型(random coefficient model),其组内相关也可为解释变量的函数。换言之,多水平模型可对不同水平上的误差方差进行深入和精细的分析。 组内相关的度量 随机系数模型(Random Coefficient Model) 组内相关与解释变量有关 反应变量向量的协方差结构 固定与随机参数估计 多水平模型的应用 (3) 不要求每个个体都有同样多的测量点,即缺失测量点并不增加拟合生长曲线的难度; (4) 便于在生长曲线中引入其它解释变量,如性别、营养状况和地区等,分析其对生长过程的影响。 应用前景 谢 谢!
文档评论(0)