- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4-2 逻辑回归
高级统计分析心理系 卢珊yoyolus@逻辑回归Logistic Regression心理学研究中经常遇到分类型变量二分类变量:自杀与非自杀网络成瘾与非网络成瘾抑郁症与非抑郁症阅读障碍与非阅读障碍多分类有序变量:智商水平(低、中、高)治愈效果(治愈、显效、好转、无效)多分类无序变量:干预方法(A、B、C)测量方法(甲、乙、丙)对于分类变量——列联表、当有混杂因素,可用M-H分层分析进行检验。但存在局限:虽然可以控制若干因素的作用,但无法描述其作用大小及方向,更不能考察各因素间是否存在交互作用;对样本含量要求高,控制的分层因素越多,单元格被划分的越细,格子中频数可能很小甚至为0,检验结果不可靠无法对连续性自变量的影响进行分析。能否建立类似线性回归的方程,对这种数据进行分析? 比如,定义阳性结果为1、阴性结果为0(下雨为1、未下雨为0)回归分析的分类连续型因变量 (y) --- 线性回归分析一个因变量 y分类型因变量 (y) ---Logistic 回归分析生存时间因变量 (t) ---生存风险回归分析时间序列因变量 (t) ---时间序列分析路径分析结构方程模型分析多个因变量(y1,y2…yk)回忆回归分析Regression analyze:研究一个或一组变量的变动对另一个变量的变动的影响程度的方法用来研究可以测量的变量之间的关系的一个数学工具 研究者遇到的问题自变量和因变量是否有联系 这种联系是强是弱 能否根据自变量来预测因变量 如果能,如何预测,预测误差是多少,有效性如何? 对上述关系进行定量描述的数学模型为回归模型 其中,Y为因变量,E(Y/X)为给定x的条件下Y的条件均值,ε为随机变量,且E(ε)=0 相应的回归方程 当 时,称之为线性回归方程,这里 回归分析的步骤: 收集这些变量在一组单元或案例中的每一个数据。对Y和X分别进行k次独立观测,得到一个样本集(Yi, Xi) 对回归参数进行估计:估计方法有很多种,对于线性回归分析主要采用最小二乘法,即选择参数估计量,使得随机误差项εi (因变量的观测值与模型估计值之间的差值)的平方和达到最小。假设检验用于检验拟合模型对被研究的关系是否合适、有用。 多元线性回归的局限因变量必须是连续性变量而大量的分类变量(某几个选择甚至“是否”两种类型选择)当多元回归的这一重要假设违反时,无论假设检验或计算置信区间均失去合理性使用分类因变量进行多元线性回归将严重违反其对数据的假设条件标准线形回归方程概率:描述当自变量变化时,因变量的发生概率会怎样变化。用何方法拟合?(最小二乘法、加权最小二乘法):概率取值(0,1);模型右侧(-∞,+ ∞ )非直线关系,S型曲线变换函数!!Logit变换1970,Cox引入人口学领域的Logit变换(Logit Transformation)Logit变换: 把出现某种结果的概率与不出现的概率之比称为比值Odds(Odds=P/1-P) 其对数λ=ln(Odds)=ln(P/1-P)P=0Logit(P)=ln(0/1)= -∞P=0.5 Logit(P)=ln(0.5/0.5)= 0P=1Logit(P)=ln(1/0)= + ∞ Logit(P)范围(-∞,+ ∞);与自变量线性关系;Logistic 回归模型不能直接分析变量y与x的关系 y=f(x)y=1,0x任意y取某个值的概率变量p与x 的关系p=p(y=1|x)=f(x)0≤p≤1, x任意Logistic回归模型存在,且不唯一如何解决?不存在模型简介一、什么是Logistic 回归分析?研究因变量y取某个值的概率变量p与自变量x的依存关系。p=p(y=1|x)=f(x)Logistic 回归模型:其中exp[u]表示自然对数底的指数函数,即 eu.二、Logistic回归分析基本思想利用一组观测数据拟合一个logistic模型,然后借助于这个模型来揭示总体中若干个自变量与一个因变量取每个值的概率之间的依存关系,并评估用这一模型模拟相关事物变化规律的准确性。Logistic回归:消除其他自变量影响后,每个自变量的变化是否影响因变量取某个值的概率的变化估计在其他自变量固定不变的情况下,每个自变量对因变量取某个值的概率的数值影响大小三、Logistic回归分析的分类Logistic回归分析按数据的类型:非条件logistic回归分析(成组数据)条件logistic回归分析(配对病例-对照数据)按因变量取值个数:二值logistic回归分析多值logistic回归分析按自变量个数:一元logistic回归分析多元logistic回归分析四、Logistic 回归分析的数学模型两个注意:Logistic回归模型对变量的要求。因变量:分类变
文档评论(0)